Вопросы на экзамен

  1. Разделы машинного обучения.

  2. Разведывательный анализ данных.

  3. Масштабирование признаков.

  4. Метод наименьших квадратов.

  5. Метод классического градиентного спуска.

  6. Линейная регрессия: понятие, функция потерь, метрики качества модели.

  7. Метод стохастического градиентного спуска.

  8. Метод максимального правдоподобия.

  9. Регуляризация в моделях машинного обучения.

  10. Линейная регрессия в задачах классификации.

  11. Линейная регрессия в задачах классификации: функция потерь, метрики качества модели.

  12. Алгоритм построения дерева решений.

  13. Критерии информативности и критерий прироста информации в деревьях принятия решений для моделей регрессии и классификации.

  14. Способы снижения корреляции данных для ансамблевых моделей.

  15. Алгоритм построения случайного леса.

  16. Out-of-Bag ошибка.

  17. Кроссвалидация данных.

  18. Способы предотвращения переобучения моделей.

  19. Алгоритм построения модели градиентного бустинга.

  20. Алгоритм построения модели  AdaBoost

  21.  Алгоритм построения модели стохастического градиентного бустинга.

  22. Меры и метрики расстояния между объектами

  23. Алгоритм kNN

  24. Алгоритм K-means (K-средних)

  25. Кластеризация: внутренние метрики, внешние метрики.

  26. Алгоритмы снижения размерности: отбор признаков.

  27.  Алгоритмы снижения размерности: метод случайных проекций.

  28. Метод главных компонент (PCA).

  29. PCA и SVD.

  30. Алгоритм DBSCAN.

  31. Иерархическая кластеризация.