Чемпионат среди Data Scientists на BigData Conference 2015
Проводится при поддержке Сбербанка. Призовой фонд: 100 000 рублей.В рамках международной конференции по Big Data (ICBDA 2015) при поддержке Сбербанка состоится Чемпионат по построению модели оттока клиентов банка с Призовым фондом 100 000 рублей. К участию приглашаются как физические лица, так и команды.
Прием заявок - до 23:59 (UTC+03:00) 4 сентября 2015 года.
Финал Чемпионата, где будут презентованы модели, пройдет на конференции 18 сентября 2015 года
Сбербанк использует технологии Big Data для того, чтобы консолидировать большие объемы данных и проводить на них аналитические исследования. Целью исследований является нахождения способов сокращения расходов, расширения клиентской базы и предложение более персонализированных услуг клиентам.
Поэтому в рамках International Conference on BigData and its Applications при поддержке Сбербанка пройдет Чемпионат среди Data Scientists, задачей которого будет определение клиентов Банка, склонных к оттоку, по некоторым имеющимся признакам, характеризующих поведение клиентов. Решение данной задачи позволит Банку принять превентивные меры по удержанию клиентов, которые потенциально могут отказаться от услуг Банка в ближайшее время.
1. ОПИСАНИЕ ЗАДАЧИ
Для каждого клиента рассчитать вероятность его ухода в отток в течение месяца, следующего за месяцем построения модели.
Пример: входные данные для построения модели – это 3 полных месяца: март, апрель, май. Анализ по данной модели строится в июне на данных за март, апрель, май. В результате работы модели должен быть получен бинарный прогноз (1 или 0) того, что клиент прекратит использование услуг банка в течение июля.
2. ТРЕБОВАНИЯ К УЧАСТНИКАМ
Участвовать в Чемпионате могут любые физические лица, группы физических лиц или юридические лица при условии подписания ими специального Соглашения о неразглашении, которое нужно будет распечатать и прислать Почтой России по адресу: ПАО Сбербанк, 117997, г. Москва, ул. Вавилова, д.19. На конверте указывается полное ФИО Участника Чемпионата и наименование предмета: «Участие в чемпионате. Подписанное Соглашение о конфиденциальности». Текст Соглашения участники получают на электронную почту после оформления заявки на участие
При этом претендовать на Призовой фонд в 100 000 рублей смогут только те из них, кто наряду с прогнозом предоставит исходный код модели на языке Python на условиях, определяемых MIT License, и ссылки на внешние источники данных, и библиотеки, использованные при составлении модели. Остальные участники Чемпионата примут участие в общем рейтинге прогнозов, но без права претендовать на Призовой фонд.
3. ОПИСАНИЕ ДАННЫХ
Для решения данной задачи участникам Чемпионата после регистрации будет представлено 6 наборов данных.
1. Общая информация
- Общее количество файлов: 6
- Наименование файлов: train.csv; column_names_train.csv; target_train.csv; column_names_target_train.csv; target_test.csv; column_names_target_test.csv
2. Детальное описание
1) column_names_train.csv
Файл содержит название колонок файла train.csv
2) train.csv
Файл содержит обезличенные данные о клиенте. Всего 58 показателей (Y1-Y58) и 4 ID (ID_1_1, ID_1_2, ID_2_1, ID_2_2). Каждая пара (ID_1_1 и ID_1_2) или (ID_2_1 и ID_2_2) характеризует только одного клиента
3) column_names_target_train.csv
Файл содержит название колонок файла target_train.csv
4) target_train.csv
Файл содержит информацию о целевом событии (поле target) для клиентов из файла train.csv. Отток клиентов определяется неким условием, назовем его условием А. Считается, что клиент ушел в отток в текущем месяце, если в каждом из последующих 3-х месяцев выполняется условие А.
Важно: существуют клиенты, для которых целевое событие из файла train.csv не определено.
Пара идентификаторов (ID_1 и ID_2) характеризует только одного клиента. Пара идентификаторов (ID_1 и ID_2) – это либо пара (ID_1_1 и ID_1_2), либо (ID_2_1 и ID_2_2)
5) column_names_target_test.csv
Файл содержит название колонок файла target_test.csv
6) target_test.csv
Файл содержит список клиентов, характеризующихся парой идентификаторов (ID_1 и ID_2). Для каждого из данных клиентов необходимо проставить значение в поле target о целевом событии: 1 – клиент ушел в отток, 0 – клиент не ушел в отток.
Описание цели: Для каждого клиента из файла target_test.csv проставить значение 0 или 1 в поле Target
Использование внешних источников данных (например, находящейся в свободном доступе информации об экономическом состоянии регионов) допустимо, но должно явно указываться в описании алгоритма и не должно нарушать ничьих авторских и других прав.
4. ОЦЕНКА РЕЗУЛЬТАТОВ И НАГРАЖДЕНИЕ ПОБЕДИТЕЛЕЙ
Оценка результатов работы модели будет производиться по нормализованному коэффициенту Gini
Итоговый файл участников Чемпионата – это файл test.csv с заполненным полем target, в котором должна содержаться следующая информация: 1 – клиент уйдет в отток, 0 – клиент не уйдет в отток
Каждый участник до 23:59 (UTC+03:00) 16 сентября 2015 года должен предоставить итоговый файл test.csv с прогнозом. Кроме того, участники претендующие на Призовой фонд должны предоставить исходный код модели в соответствии с Пунктом 2 настоящих Правил и описание используемых внешних источников данных..
По прогнозу, построенному в файле test.csv, судьями будет рассчитан коэффициент Gini. Победителем будет признан участник с наибольшим Gini.
Объявление топ 5 финалистов и главного победителя состоится в 16:00 на площадке конференции ICBDA 18 сентября 2015 года.
Участники Чемпионата, приславшие модель, отвечающую требованиям качества организаторов, получают один бесплатный билет на конференцию. Остальные участники команд и не прошедшие отбор могут зарегистрироваться с 20% скидкой.
5. СРОКИ ПРОВЕДЕНИЯ И ЭТАПЫ ЧЕМПИОНАТА
Регистрация участников: до 23:59 (UTC+03:00) 4 сентября 2015 года
Анализ данных: 10:00 (UTC+03:00) 7 сентября 2015г. - 23:59 (UTC+03:00) 16 сентября 2015 г.
Подведение итогов: 16:00 (UTC+03:00) 18 сентября 2015 г.
Данные правила являются публичной офертой.
Для того, чтобы подать заявку от физического лица или команды, заполните специальную форму до 23:59 (UTC+03:00) 4 сентября.
-
Партнёрский материал Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 26 июня 2026, 09:44
-
Тренды Главные мемы 2026 года и их значение 26 июня 2026, 21:10
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Бизнес Как бренд пазлов «Харди Гарди» получил рекламу у блогера-миллионника, просто рассказав о своём проекте 05 июня 2026, 14:23
-
Деньги Онлайн-инкассация: как превратить наличную выручку в рабочий капитал 01 июня 2026, 10:00
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Искусственный интеллект «Мы знаем 50 миллионов книг через их описания, а не содержание»: зачем Ленинке искусственный интеллект 26 июня 2026, 11:00
-
Бизнес Более 50% предпринимателей МСП в цифровой сфере — младше 35 лет: чаще всего они открывают компьютерные клубы 26 июня 2026, 20:00
-
Россия В России создадут базу IMEI: в нее внесут заводской код телефонов — работу украденных устройств смогут блокировать 26 июня 2026, 19:20
-
Бизнес В России ввели штрафы за авторизацию пользователей через зарубежные сервисы: компании могут заплатить до 700 тыс. ₽ 26 июня 2026, 18:30
-
Деньги Россияне оформили 4 млн кредитов в мае 2026-го — это самый большой показатель за последние два года 26 июня 2026, 17:00
-
Бизнес «ВкусВилл» закроет все розничные магазины в Казахстане — товары бренда останутся на полках местных торговых сетей 24 июня 2026, 16:47
-
Ритейл Самокат обновил главную страницу приложения — пользователям стало проще искать нужные товары 24 июня 2026, 07:00
-
Технологии «Моторика» привлекла 1 млрд ₽ льготного финансирования — средства направят на развитие нейротехнологий 23 июня 2026, 16:40
-
На регате Digital Club встретятся представители бизнеса — среди них «Аэрофлот», ВТБ и Ozon Банк 22 июня 2026, 16:12