Data-MBA: Тест по итогам курса

В четверг у меня последнее занятие на курсах Data-MBA. Девять встреч с преподавателями пролетели быстро, понятийная сетка в области Machine Learning, Big Data, NLP, рекомендательных систем, Deep Learning сформировалась. 


Некоторое представление о курсе дают вопросы сегодняшнего теста. На некоторые я ответил по-памяти, чтобы ответить на другие пришлось лезть в конспект. Полюбопытствуйте, знакомы ли вам эти темы?

Тест для слушателей курса “Data MBA”
1. Назовите задачи обучения с учителем/без учителя  
2. Объясните своими словами, что означают метрики качества Precision/Recall/F-мера – почему хорошее значение 
3. Что делать, если в обучающей выборке преобладают объекты одного из классов?
4. Вы решаете задачу прогнозирования дохода на данных телеком-оператора. Можно ли выбрать для этой задачи в качестве обучающей выборки сотрудников оператора? Ответ обосновать
5. Представьте, что вы решаете задачу прогнозирования b2b оттока клиента сотового оператора. Как бы вы определили понятие "оттока"? Какие признаки вы бы использовали для этой задачи? Как бы был построен "дизайн" этой задачи? Напишите подробный ответ 
6. Вы решили построить аналитическую систему, в которой применяется машинное обучение. На какие вопросы вам нужно ответить, чтобы начать разработку? 
7.  Вы решили построить аналитическую систему, в которой применяется машинное обучение. Из чего будут состоять временные затраты? В каком процентном соотношении? 
8. Опишите ситуации, в которых вам потребуется построение инфраструктуры для обработки больших данных? Иными словами, какие данные обязывают нас строить данную инфраструктуру?
9. Какие компоненты входят в экосистему Hadoop? Для чего они предназначены
10. Опишите все этапы, которые возникают при разработке алгоритмов машинного обучения 
11. Для каких задач приходится использовать базы данных, хранящих <идентификатор, значение>? 
12. В чем риск использования данных из социальных сетей? 
13. Какие ограничения есть у API социальных сетей? 
14. Какие компоненты входят в RTB систему?
15. Для каких задач имеет смысл применять методы Deep Learning?  
Подробнее о курсе Data-MBA можно почитать здесь: http://bigdata.beeline.digital/datamba#schedule - приведена программа курса, данные о преподавателей, по этой ссылке возможна и запись. Следующий курс начнется 12 апреля 2016 года.

+ +

Комментариев нет:

Популярные сообщения

Желающие следить за новостями блога, могут подписаться на рассылку на follow.it (отписаться вы сможете в один клик). 

Еще можно подписаться на Telegram-каналы @abloud62 @abloudrealtime, где также дублируются анонсы практически всех новостей блога. 

 

Translate