Вопросы на экзамен
Вопросы на экзамен
-
Разделы машинного обучения.
-
Разведывательный анализ данных.
-
Масштабирование признаков.
-
Метод наименьших квадратов.
-
Метод классического градиентного спуска.
-
Линейная регрессия: понятие, функция потерь, метрики качества модели.
-
Метод стохастического градиентного спуска.
-
Метод максимального правдоподобия.
-
Регуляризация в моделях машинного обучения.
-
Линейная регрессия в задачах классификации.
-
Линейная регрессия в задачах классификации: функция потерь, метрики качества модели.
-
Алгоритм построения дерева решений.
-
Критерии информативности и критерий прироста информации в деревьях принятия решений для моделей регрессии и классификации.
-
Способы снижения корреляции данных для ансамблевых моделей.
-
Алгоритм построения случайного леса.
-
Out-of-Bag ошибка.
-
Кроссвалидация данных.
-
Способы предотвращения переобучения моделей.
-
Алгоритм построения модели градиентного бустинга.
-
Алгоритм построения модели AdaBoost
-
Алгоритм построения модели стохастического градиентного бустинга.
-
Меры и метрики расстояния между объектами
-
Алгоритм kNN
-
Алгоритм K-means (K-средних)
-
Кластеризация: внутренние метрики, внешние метрики.
-
Алгоритмы снижения размерности: отбор признаков.
-
Алгоритмы снижения размерности: метод случайных проекций.
-
Метод главных компонент (PCA).
-
PCA и SVD.
-
Алгоритм DBSCAN.
-
Иерархическая кластеризация.