Чемпионат среди Data Scientists на BigData Conference 2015
Проводится при поддержке Сбербанка. Призовой фонд: 100 000 рублей.В рамках международной конференции по Big Data (ICBDA 2015) при поддержке Сбербанка состоится Чемпионат по построению модели оттока клиентов банка с Призовым фондом 100 000 рублей. К участию приглашаются как физические лица, так и команды.
Прием заявок - до 23:59 (UTC+03:00) 4 сентября 2015 года.
Финал Чемпионата, где будут презентованы модели, пройдет на конференции 18 сентября 2015 года
Сбербанк использует технологии Big Data для того, чтобы консолидировать большие объемы данных и проводить на них аналитические исследования. Целью исследований является нахождения способов сокращения расходов, расширения клиентской базы и предложение более персонализированных услуг клиентам.
Поэтому в рамках International Conference on BigData and its Applications при поддержке Сбербанка пройдет Чемпионат среди Data Scientists, задачей которого будет определение клиентов Банка, склонных к оттоку, по некоторым имеющимся признакам, характеризующих поведение клиентов. Решение данной задачи позволит Банку принять превентивные меры по удержанию клиентов, которые потенциально могут отказаться от услуг Банка в ближайшее время.
1. ОПИСАНИЕ ЗАДАЧИ
Для каждого клиента рассчитать вероятность его ухода в отток в течение месяца, следующего за месяцем построения модели.
Пример: входные данные для построения модели – это 3 полных месяца: март, апрель, май. Анализ по данной модели строится в июне на данных за март, апрель, май. В результате работы модели должен быть получен бинарный прогноз (1 или 0) того, что клиент прекратит использование услуг банка в течение июля.
2. ТРЕБОВАНИЯ К УЧАСТНИКАМ
Участвовать в Чемпионате могут любые физические лица, группы физических лиц или юридические лица при условии подписания ими специального Соглашения о неразглашении, которое нужно будет распечатать и прислать Почтой России по адресу: ПАО Сбербанк, 117997, г. Москва, ул. Вавилова, д.19. На конверте указывается полное ФИО Участника Чемпионата и наименование предмета: «Участие в чемпионате. Подписанное Соглашение о конфиденциальности». Текст Соглашения участники получают на электронную почту после оформления заявки на участие
При этом претендовать на Призовой фонд в 100 000 рублей смогут только те из них, кто наряду с прогнозом предоставит исходный код модели на языке Python на условиях, определяемых MIT License, и ссылки на внешние источники данных, и библиотеки, использованные при составлении модели. Остальные участники Чемпионата примут участие в общем рейтинге прогнозов, но без права претендовать на Призовой фонд.
3. ОПИСАНИЕ ДАННЫХ
Для решения данной задачи участникам Чемпионата после регистрации будет представлено 6 наборов данных.
1. Общая информация
- Общее количество файлов: 6
- Наименование файлов: train.csv; column_names_train.csv; target_train.csv; column_names_target_train.csv; target_test.csv; column_names_target_test.csv
2. Детальное описание
1) column_names_train.csv
Файл содержит название колонок файла train.csv
2) train.csv
Файл содержит обезличенные данные о клиенте. Всего 58 показателей (Y1-Y58) и 4 ID (ID_1_1, ID_1_2, ID_2_1, ID_2_2). Каждая пара (ID_1_1 и ID_1_2) или (ID_2_1 и ID_2_2) характеризует только одного клиента
3) column_names_target_train.csv
Файл содержит название колонок файла target_train.csv
4) target_train.csv
Файл содержит информацию о целевом событии (поле target) для клиентов из файла train.csv. Отток клиентов определяется неким условием, назовем его условием А. Считается, что клиент ушел в отток в текущем месяце, если в каждом из последующих 3-х месяцев выполняется условие А.
Важно: существуют клиенты, для которых целевое событие из файла train.csv не определено.
Пара идентификаторов (ID_1 и ID_2) характеризует только одного клиента. Пара идентификаторов (ID_1 и ID_2) – это либо пара (ID_1_1 и ID_1_2), либо (ID_2_1 и ID_2_2)
5) column_names_target_test.csv
Файл содержит название колонок файла target_test.csv
6) target_test.csv
Файл содержит список клиентов, характеризующихся парой идентификаторов (ID_1 и ID_2). Для каждого из данных клиентов необходимо проставить значение в поле target о целевом событии: 1 – клиент ушел в отток, 0 – клиент не ушел в отток.
Описание цели: Для каждого клиента из файла target_test.csv проставить значение 0 или 1 в поле Target
Использование внешних источников данных (например, находящейся в свободном доступе информации об экономическом состоянии регионов) допустимо, но должно явно указываться в описании алгоритма и не должно нарушать ничьих авторских и других прав.
4. ОЦЕНКА РЕЗУЛЬТАТОВ И НАГРАЖДЕНИЕ ПОБЕДИТЕЛЕЙ
Оценка результатов работы модели будет производиться по нормализованному коэффициенту Gini
Итоговый файл участников Чемпионата – это файл test.csv с заполненным полем target, в котором должна содержаться следующая информация: 1 – клиент уйдет в отток, 0 – клиент не уйдет в отток
Каждый участник до 23:59 (UTC+03:00) 16 сентября 2015 года должен предоставить итоговый файл test.csv с прогнозом. Кроме того, участники претендующие на Призовой фонд должны предоставить исходный код модели в соответствии с Пунктом 2 настоящих Правил и описание используемых внешних источников данных..
По прогнозу, построенному в файле test.csv, судьями будет рассчитан коэффициент Gini. Победителем будет признан участник с наибольшим Gini.
Объявление топ 5 финалистов и главного победителя состоится в 16:00 на площадке конференции ICBDA 18 сентября 2015 года.
Участники Чемпионата, приславшие модель, отвечающую требованиям качества организаторов, получают один бесплатный билет на конференцию. Остальные участники команд и не прошедшие отбор могут зарегистрироваться с 20% скидкой.
5. СРОКИ ПРОВЕДЕНИЯ И ЭТАПЫ ЧЕМПИОНАТА
Регистрация участников: до 23:59 (UTC+03:00) 4 сентября 2015 года
Анализ данных: 10:00 (UTC+03:00) 7 сентября 2015г. - 23:59 (UTC+03:00) 16 сентября 2015 г.
Подведение итогов: 16:00 (UTC+03:00) 18 сентября 2015 г.
Данные правила являются публичной офертой.
Для того, чтобы подать заявку от физического лица или команды, заполните специальную форму до 23:59 (UTC+03:00) 4 сентября.
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Деньги Онлайн-инкассация: как превратить наличную выручку в рабочий капитал 01 июня 2026, 10:00
-
Бизнес «Малый бизнес драйвит всё»: как компании из Архангельска растут на терпении, связях и самоиронии 25 мая 2026, 18:03
-
Банки Владимир Скворцов: «Наша задача — снизить страховые риски клиента и быстро выплатить, если что-то случится» 19 мая 2026, 16:00
-
Бизнес «Команде не вырасти выше лидера»: как изменить неписаные правила взаимодействия в группе 19 мая 2026, 10:00
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Искусственный интеллект Выступление Владимира Путина и новые правила для маркетплейсов: главные события и тезисы третьего дня ПМЭФ–2026 05 июня 2026, 22:00
-
Искусственный интеллект Развитие ИИ затронет 60% профессий — каждая десятая специальность может исчезнуть с рынка труда 05 июня 2026, 21:26
-
Технологии Яндекс Карты добавили 120 тыс. отметок о доступности мест маломобильным людям: данные обновляет ИИ — автоматически 05 июня 2026, 20:42
-
Искусственный интеллект Anthropic предложила ИТ-компаниям приостановить разработку ИИ — эксперты опасаются потери контроля над нейросетями 05 июня 2026, 20:06
-
Банки ИИ, e-commerce и инвестиции: Владимир Путин на ПМЭФ–2026 обозначил цифровые и экономические приоритеты России 05 июня 2026, 19:30
-
Бизнес С 16 по 19 июня пройдёт форум недвижимости «Движение» — в 2026 году его впервые посетят не только девелоперы 05 июня 2026, 19:07
-
Технологии Минцифры предложило ввести аренду самокатов по биометрии — систему протестируют в «Сириусе» 05 июня 2026, 15:15
-
Технологии Средний чек на вычислительные мощности для ИИ в России вырос на 64% — до 2,3 млн ₽ в месяц 04 июня 2026, 20:10