Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.
Эксперты с опытом работы в NVIDIA, Coursera, Яндекс, Amazon AWS, Sberbank, Raiffeisenbank и CERN, преподаватели Coursera, МГУ, МФТИ, ВШЭ, Harbour.Space University научат участников работать с нейронными сетями, обучать ансамбли деревьев, расскажут, как правильно использовать инструменты для работы с большими данными.
Мы изучаем:
Обучение рассчитано на специалистов с опытом программирования на Python и базовыми знаниями в математике (матрицы, производные)
Опыт программирования на Python и базовые знания в математике (матрицы, производные)
Эксперты-практики BigData Team
Выпускники курсов HiBrain получают уникальную возможность применить новые знания: компании-партнёры проекта ждут наших слушателей на стажировки и предлагают трудоустройство.
Базовые операции с данными в numpy, построение графиков функций с matplotlib. Оптимизация функций с помощью scipy. Ввизуализация данных с помощью seaborn. Базовый конвейер обработки данных и построение первой модели с помощью sklearn
Применение алгоритмов Scikit-learn к синтетическому набору данных и к данным соревнования Kaggle Inclass (классификация, регрессия). Логистическая регрессия, практика обучения моделей с помощью SGD. Метод опорных векторов (Support Vector Machine), ядра. Настройка параметров, кросс-валидация, предобработка данных (строки, пропуски, категориальный признаки)
Практика обучения деревьев на наборах данных (MNIST, UCI, кредитный скоринг). Визуализация деревьев. Работа с признаками и пропущенными значениями в деревьях. Практические аспекты - оценка времени работы, прунинг деревьев
Общие методы построения композиций - усреднение, бустинг, блэндинг, стэкинг. Бустинг и GBM. Выбор параметров в ансамблях решающих деревьев. Сравнение Random Forest и GBDT с демонстрацией. Связь корреляция между ответами моделей и качеством модели в бэггинге. Bias-variance trade-off на примере бэггинга и бустинга. Преимущества и недостатки RF и GBDT. XGBoost, LightGBM
Нейронные сети и сверточные нейронные сети, общие веса, локальность иерархичность. Слои в сверточных сетях, функции потерь для классификации, регуляризация нейросетей. Эффективный методы вычисления градиентов, проверка реализации разностным дифференцированием
Рекуррентные нейронные сети в задаче анализа сигналов и естественного языка. Генеративные модели на основе RNN. Механизм внимания (Attention mechanism) в задаче машинного перевода и других задачах. Сверточные нейронные сети в задачах обработки текста, сравнение с рекуррентными нейронными сетями. DNN на практике: инициализация, предобработка данных, модельный зоопарк, дообучение, вычисления на видкеокартах, визуализация
Определение координат дома и работы человека по GPS-треку (определение регулярных координат с помощью DBSCAN). Метод главных компонент на практике. Применение PCA и tSNE для визуализации данных, сжатия данных, предобработки датасета
Hadoop, HDFS, MapReduce, Spark