logo-hibrain

Машинное обучение онлайн

Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.

  • Площадка:Big Data Team
  • Продолжительность:1 месяц
  • Дата:в удобное время
  • Стоимость:от 35 000 рублей
Машинное обучение онлайн

О курсе

Эксперты с опытом работы в NVIDIA, Coursera, Яндекс, Amazon AWS, Sberbank, Raiffeisenbank и CERN, преподаватели Coursera, МГУ, МФТИ, ВШЭ, Harbour.Space University научат участников работать с нейронными сетями, обучать ансамбли деревьев, расскажут, как правильно использовать инструменты для работы с большими данными.

Мы изучаем:

course-info
  • ml
    ml
  • bigdata
    bigdata

Кому подойдет курс

  • Обучение рассчитано на специалистов с опытом программирования на Python и базовыми знаниями в математике (матрицы, производные)

Необходимые навыки

  • Опыт программирования на Python и базовые знания в математике (матрицы, производные)

Эксперты

Эксперты-практики BigData Team

  • Алексей Драль
    Алексей Драль
    Founder & СEO, BigData Team, читает курс "Введение в машинное обучение и библиотеки ML для Python", "Линейные модели, регуляризация, SVM, метрики качества", "Обучение без учителя (Unsupervised Learning)"
  • Дмитрий Игнатов
    Дмитрий Игнатов
    Заведующий лабораторией моделей и методов вычислительной прагматики, ВШЭ, читает курс "Деревья", "Ансамбли решающих деревьев"
  • Радослав Нейчев
    Радослав Нейчев
    Senior Quantitative Analysis Officer, Raiffeisenbank, читает курс "Нейронные сети и введение в глубокое обучение (Deep Learning)","Deep Learning: CNN, RNN, Attention"
  • Павел Клеменков
    Павел Клеменков
    Chief Data Scientist (Data Platform), NVIDIA, читает курс "Погружение в большие данные (Big Data)"

Карьера

Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.

    Программа курса

    Базовые операции с данными в numpy, построение графиков функций с matplotlib. Оптимизация функций с помощью scipy. Ввизуализация данных с помощью seaborn. Базовый конвейер обработки данных и построение первой модели с помощью sklearn

    Применение алгоритмов Scikit-learn к синтетическому набору данных и к данным соревнования Kaggle Inclass (классификация, регрессия). Логистическая регрессия, практика обучения моделей с помощью SGD. Метод опорных векторов (Support Vector Machine), ядра. Настройка параметров, кросс-валидация, предобработка данных (строки, пропуски, категориальный признаки)

    Практика обучения деревьев на наборах данных (MNIST, UCI, кредитный скоринг). Визуализация деревьев. Работа с признаками и пропущенными значениями в деревьях. Практические аспекты - оценка времени работы, прунинг деревьев

    Общие методы построения композиций - усреднение, бустинг, блэндинг, стэкинг. Бустинг и GBM. Выбор параметров в ансамблях решающих деревьев. Сравнение Random Forest и GBDT с демонстрацией. Связь корреляция между ответами моделей и качеством модели в бэггинге. Bias-variance trade-off на примере бэггинга и бустинга. Преимущества и недостатки RF и GBDT. XGBoost, LightGBM

    Нейронные сети и сверточные нейронные сети, общие веса, локальность иерархичность. Слои в сверточных сетях, функции потерь для классификации, регуляризация нейросетей. Эффективный методы вычисления градиентов, проверка реализации разностным дифференцированием

    Рекуррентные нейронные сети в задаче анализа сигналов и естественного языка. Генеративные модели на основе RNN. Механизм внимания (Attention mechanism) в задаче машинного перевода и других задачах. Сверточные нейронные сети в задачах обработки текста, сравнение с рекуррентными нейронными сетями. DNN на практике: инициализация, предобработка данных, модельный зоопарк, дообучение, вычисления на видкеокартах, визуализация

    Определение координат дома и работы человека по GPS-треку (определение регулярных координат с помощью DBSCAN). Метод главных компонент на практике. Применение PCA и tSNE для визуализации данных, сжатия данных, предобработки датасета

    Hadoop, HDFS, MapReduce, Spark

    course-program