089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев
PyData Moscow, 13 октября 2018 г.
Градиентный бустинг — метод машинного обучения, появление которого привело к прорыву в решении многих задач, включая поиск в интернете, создание рекомендательных систем и прогнозирование погоды. На протяжении многих лет он остаётся основным методом работы с неоднородными признаками, зашумлёнными данными и сложными зависимостями.
CatBoost — это библиотека градиентного бустинга с открытым исходным кодом. Она превосходит по качеству аналоги и имеет дополнительные преимущества. CatBoost поддерживает работу с категориальными признаками (например, жанрами музыки, ID устройства, URL и т. д.) без предобработки данных. У него очень хорошие дефолтные параметры, поэтому их не нужно настраивать для получения качественных моделей. А GPU-реализация CatBoost — самая быстрая среди общедоступных реализаций градиентного бустинга.
С возможностями библиотеки мы будем знакомиться на примере решения задачи классификации. Вместе мы пройдём все этапы построения модели прогнозирования и рассмотрим следующие темы:
- Выбор подходящих функций потерь и метрик для оптимизации.
Обучение модели.
- Визуализация процесса обучения и кросс-валидации.
- Работа со встроенным детектором переобучения.
- Выбор оптимального порога принятия решения.
- Важность признаков и интерпретация прогнозов модели.
- Применение обученной модели к тестовым данным.
Для участия мастер-классе нужен настроенный Jupyter Notebook с установленными библиотеками: catboos, ipywidgets, sklearn, matplotlib, shap.
Никита Дмитриев
Окончил механико-математический факультет МГУ и Школу анализа данных. В Яндексе занимается разработкой систем машинного обучения.
Другие материалы PyData Moscow –
1 view
440
116
3 months ago 00:03:51 1
KIKI - Get Up [Official MV]
6 months ago 01:29:53 1
Матвеенко В. Н. - Коллоидная химия - Реология
6 months ago 02:14:47 1
Ваше послание из магического мира. Таро поток
6 months ago 00:40:17 1
Напутствие и информация от Рода.
7 months ago 01:23:42 1
Кураков А. В. - Низшие растения - Отдел Аскомикота
7 months ago 00:03:54 1
KEYGEN CHURCH - Tenebre Rosso Sangue (ULTRAKILL P-2 Theme #1)
8 months ago 00:12:39 1
ОКУНЬ БЕЗ УМА от ЭТОЙ ПРИМАНКИ / РЫБАЛКА на СПИННИНГ
8 months ago 00:09:09 1
Как выбрать ЗАГОРОДНЫЙ ДОМ? Обзор современного и комфортного ДОМА МЕЧТЫ | Проект от А до Я
9 months ago 00:15:24 1
Клайв Стейплз Льюис. Письма Баламута
10 months ago 00:31:04 1
Фильм к 50-летию легендарного Нижневартовского УБР №1 (2014)
10 months ago 00:59:50 1
Mephistofeles - Devotional Doom (Full Album 2017)
11 months ago 02:29:07 2
Metallica Live S&M (Subtitulado) - FULL CONCERT 1080p ᴴᴰ HQ
11 months ago 00:36:41 1
MASTER BOOT RECORD - INTERNET PROTOCOL
11 months ago 00:05:08 1
บุญผลา สัญญาฮัก - ใหม่ พัชรี Ft. วิเชียร ไชยเลิศ [ Official MV ]
12 months ago 00:52:29 1
The Döner Kebap from Heaven | Yaprak Döner Kebap | Turkish Street Food in Berlin
1 year ago 00:19:06 1
ШАПКА Бини с дырками и модной макушкой🔥 | Мастер-класс 🧶
1 year ago 02:29:06 3
Metallica & San Francisco Symphony: S&M
1 year ago 00:05:56 1
05 ПРИЗ В ЧЕСТЬ ДНЯ ПОБЕДЫ . Жер. и коб. рожд. 2017 г. Воронежский ипподром
1 year ago 01:09:20 1
Профильный ЕГЭ 2023 математика. Задача 4. Сложная теория вероятностей
1 year ago 00:00:00 1
The resonance has made the paradigm shift unstoppable - DAY 2 UPDATE
1 year ago 00:04:56 2
ЖАНЕ, ВОДОПАДЫ! КУПАЮСЬ В ЛЕДЯНОЙ ВОДЕ В ОКТЯБРЕ! :) 😄 #геленджик2023 #октябрь2023 #осень2023 #жане
1 year ago 00:06:52 1
КВ-2 ДРЫНОМЁТ
1 year ago 01:02:34 4
Find Your Energy 037 - Progressive Trance, Uplifting Trance, Vocal Trance