[GeekBrains] Машинное обучение. Часть 3 5 (2020)

serafim

Житель Разулы
Команда форума
Разула в сердце
Регистрация
25 Апр 2016
Сообщения
78.862
Реакции
195.704
Ra
243.709
GeekBrains. Машинное обучение. Часть 3/5 (2020)


Программа
30+ онлайн-уроков, более 65 часов обучающего контента и практика после каждого занятия
Длительность: 5 месяцев.



Модуль 3. Библиотеки Python для Data Science: продолжение

Модуль 5. Системы машинного обучения в Production

Программа курса подробно

Теория вероятностей и математическая статистика
  • Случайные события. Условная вероятность. Формула Байеса. Независимые испытания

    Дискретные случайные величины. Закон распределения вероятностей. Биномиальный закон распределения. Распределение Пуассона

    Описательная статистика. Качественные и количественные характеристики популяции. Графическое представление данных

    Непрерывные случайные величины. Функция распределения и плотность распределения вероятностей. Равномерное и нормальное распределение. Центральная предельная теорема

    Проверка статистических гипотез. P-значения. Доверительные интервалы. A/B-тестирование

    Взаимосвязь величин. Параметрические и непараметрические показатели корреляции. Корреляционный анализ

    Многомерный статистический анализ. Линейная регрессия

    Дисперсионный анализ. Логистическая регрессия
Курсовой проект
Разведочный анализ данных (EDA) на основе выбранного датасета: визуализация, корреляционный, дисперсионный и факторный анализ


Библиотеки Python для Data Science: Numpy, Matplotlib, Scikit-learn
  • Введение в курс. Вебинар

    Вычисления с помощью Numpy. Работа с данными в Pandas. Видеоурок

    Вычисления с помощью Numpy. Работа с данными в Pandas. Вебинар

    Визуализация данных в Matplotlib. Видеоурок

    Визуализация данных в Matplotlib. Вебинар

    Обучение с учителем в Scikit-learn. Видеоурок

    Обучение с учителем в Scikit-learn. Вебинар

    Обучение без учителя в Scikit-learn. Видеоурок

    Обучение без учителя в Scikit-learn и введение в итоговый проект. Вебинар

    Консультация по итоговому проекту. Вебинар
Курсовой проект
Соревнование на платформе Kaggle по предсказанию цены на недвижимость, решение задачи регрессии


Библиотеки Python для Data Science: продолжение
  • Введение в задачу классификации. Постановка задачи и подготовка данных

    Анализ данных и проверка статистических гипотез

    Построение модели классификации

    Оценка и интерпретация полученной модели. Обсуждение курсового проекта
Курсовой проект
Соревнование на платформе Kaggle по кредитному скорингу, решение задачи классификации


Алгоритмы анализа данных
  • Алгоритм линейной регрессии. Градиентный спуск

    Масштабирование признаков. L1- и L2-регуляризация. Стохастический градиентный спуск

    Логистическая регрессия. Log Loss

    Алгоритм построения дерева решений

    Случайный лес

    Градиентный бустинг (AdaBoost)

    Классификация с помощью KNN. Кластеризация K-means

    Снижение размерности данных
Курсовой проект
Участие в одном или двух соревнованиях на Kaggle: предсказать средний балл на экзамене по математике, который получают ученики репетиторов (задача регрессии); предсказать, подойдет ли репетитор для подготовки к экзамену по математике (задача классификации)


Системы машинного обучения в Production
  • Введение в задачу предсказания оттока. Формализация задачи и сбор сырых данных

    Загрузка данных и построение обучающей выборки. Анализ и предобработка датасета. Балансировка классов

    Выбор и обучение модели на отобранных признаках. Сравнение качества и оценка модели

    Оценка потенциального влияния на бизнес. Масштабирование решения

    Подготовка к продакшену. Планировщик задач и перенос проекта из Jupyter в PyCharm
Курсовой проект
Оценка потенциального влияния на бизнес ML-решения, построение модели оттока клиентов в игровых проектах и подготовка кода для Production в PyCharm



Продажник:

Войти или Зарегистрироваться чтобы увидеть скрытый текст.

Скачать:
 
Сверху