Анна Вероника Дорогуш (Yandex) – о технологии CatBoost на Big Data Conference
По итогам прошедшей 15 сентября 2017 года Big Data Conference, организованной Rusbase и Global Innovation Labs, публикуем подробные отчеты с выступлений всех спикеров.
В рамках конференции в трёх залах были представлены кейсы в «Бизнес-треке», технологические решения в «Техническом треке» и доклады на «Научном семинаре». Общий отчет с мероприятия можно найти по ссылке.
Анна Вероника Дорогуш, представляющая «Яндекс», выступила в «Техническом треке» с темой «Градиентный бустинг и сферы его применения. Технология CatBoost».
Благодаря сервису Penxy мы можем поделиться с вами презентацией Анны Вероники, которую можно не просто посмотреть, но и послушать:
После выступления аудитория задавала Анне Веронике вопросы через специальный сервис WhenSpeak. Мы публикуем «публичное интервью» с Анной Вероникой.
Как эта библиотека связана с MatrixNet?
CatBoost – это следующая версия Матрикснета. Но говорить о полной замене одной технологии на другую пока нельзя. Матрикснет по-прежнему отлично показывает себя во многих задачах, тем не менее, с развитием CatBoost мы действительно планируем внедрить его в большинство сервисов «Яндекса», где он дополнит или заменит Матрикснет.
Catboost может сырыми брать категориальные фичи, наподобие LightGBM?
Да, CatBoost работает с сырыми категориальными фичами, но не как LightGBM, а более оптимально.
А сравнение производительности разных инструментов?
Время обучения Катбуста пока что больше, чем у XGBoost и LightGBM, но мы работаем над ускорением алгоритма и надеюсь, что эту разницу скоро получится убрать.
Почему cat? Связано ли это с котиками? :)
CatBoost – от Categorical Boosting (категориальный бустинг). Оптимальная поддержка категориальных факторов – основная отличительная черта алгоритма.
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter