«Больше всего нас интересуют деньги» – как мы предсказываем, вернет ли заемщик долг
Кейс: внедрение скоринговой модели в Испании
Испания – очень важный рынок для любой финансовой компании, особенно для тех, кто работает в сфере небанковского кредитования. И конкуренция на этом рынке очень жесткая. Выжить там смогут только те, у кого получится свести издержки к нулю.
Андрей Атрашкевич, руководитель направления Data Scienсe финтех-компании ID Finance, рассказал Rusbase об опыте внедрения скоринговой модели в Испании, с помощью которой можно отсекать неблагонадежных заемщиков.
Скоринг может заменить работу многих специалистов
В Испании сложно сделать прогноз о том, вернет ли заемщик деньги вовремя или нет. В бюро кредитных историй этой страны можно узнать лишь обрывочную информацию, которую очень сложно достать.
В России любой финансовый институт, к примеру, может увидеть погашенную просрочку по кредиту, сделанную несколько лет назад.
Удачная скоринговая модель может заменить работу многих специалистов. Правильно рассчитанная вторая цифра после запятой в определенном коэффициенте может сэкономить несколько миллионов евро.
Один из главных показателей для скоринговых моделей – это индекс Джини. Он показывает насколько система может разделить клиентов на тех, кто вернет долг вовремя и на тех, кто опоздает с платежом или начнет от них уклоняться. Чем ближе индекс Джини к единице, тем успешнее модель.
Этот показатель у моделей, построенных только на основе анкеты, без данных кредитной истории, не превышает 0,30. Работать с такой моделью нельзя: есть огромная вероятность невозвратов и в конченом счете убытков.
Показатель Джини определяет не только точность скоринговой модели, но и выгоду от ее применения на практике.
В этом году мы внедрили скоринговую модель в Испании и достигли показателя Джини 0,7.
Если заемщику 60 лет и у него iPhone – это подозрительно
Система интересна тем, что в ней используется не так много информации, как в других моделях. Изначально есть данные, которые заемщик указывает при заполнении заявки на сайте:
- Пол
- Возраст
- Доход
- Семейное положение
- Наличие детей.
Далеко не все данные мы можем проверить, но эта информация тоже очень полезна: мошенники, например, склонны завышать свой доход относительно среднего уровня для конкретной возрастной группы, профессии или региона.
Мы анализируем маркеры, позволяющие оценить достоверность информации, которую заемщик указал о себе: смотрим с какого устройства он заполнил анкету кредита, какое разрешение экрана на этом устройстве, какая операционная система установлена на компьютере и какой мобильный оператор поставляет услуги связи.
По отдельности эта информация практически ничего не может рассказать о клиенте, но, если сопоставить данные, например, семейное положение и количество детей и доход, вырисовывается портрет заемщика.
Если заемщику за 60 лет, а он пользуется последним iPhone, это может насторожить, равно как и использование мобильного номера, зарегистрированного за несколько дней до подачи заявки на кредит. Конечно, мы берем и данные неполной кредитной истории.
Скоринг должен быть надежным
Модель, разработанная для Испании, использует минимум информации, однако благодаря правильной обработке всех данных и использованию достаточно сложных математических вычислений выдает точный прогноз.
Безусловно, невозможно достоверно предсказать поведение каждого отдельного заемщика, но когда мы ретроспективно смотрим на несколько месяцев работы, то видим, что наша новая скоринговая модель успешно разделяет «хороших» и «плохих» клиентов.
Для оценки успешности модели важно оценивать и ресурсы, затраченные на ее разработку. Например, на реализацию кейса для Испании ушло порядка 30 часов рабочего времени отдела data scientist.
Работа data scientist – это не только разработка скоринговых моделей. 90% рабочего времени уходит на проверку данных, их полноту, корректность и непротиворечивость, и только 10% – это прикладная математика в действии.
Чтобы скоринг работал, сама модель должна быть надежной, как автомат Калашникова.
То есть, удачная модель должна быть одновременно простой и не ломаться, если изменяются входящие данные – распределения характеристик клиентов или кредитная политика компании.
После внедрения модели в Испании мы разработали еще четыре
Использование сложных алгоритмов машинного обучения на сверхбольших объемах данных – это сегодняшний инфо-мейнстрим. Про это говорят представители крупнейших банков. Однако количество реальных кейсов ничтожно мало.
Большая часть внедренческих решений получаются дорогими, непрозрачными для анализа и неподдающимися контролю. Кроме того, они постоянно ломаются: даже небольшие изменения клиентского потока лишают использование модели смысла — она перестает сегментировать клиентов.
После внедрения первой модели в Испании мы разработали еще четыре – для других продуктов. Все модели работают несколько месяцев, удерживая индекс Джини на уровне 0,7. Когда далекие от аналитики люди спрашивают, с чем связана наша работа, я отвечаю, что мы предсказываем будущее.
Если точнее, мы как раз отвечаем за техническую часть этого процесса – разрабатываем скоринговые модели, которые способны предугадать поведение клиентов. Больше всего нас интересуют деньги: мы можем с высокой точностью предсказать, вернет заемщик долг или нет.
Материалы по теме:
Как fraud-скоринг увеличит выдачи кредитов на 50%
Заемные средства для бизнеса – хорошо или плохо?
Кредиты сейчас меняются так же, как автомобили в начале 20 века
Как выглядит типичный день дата-сайентиста в петербургском стартапе
Что такое Big data: собрали всё самое важное о больших данных
-
Партнёрский материал Как компании из Архангельска растут на терпении, связях и самоиронии 29 мая 2026, 14:33
-
Технологии Подключённые автомобили: как интернет меняет автопром 25 марта 2026, 13:17
-
Личное Фёдор Овчинников: «Пять месяцев в тундре — путешествие в другое измерение» 14 мая 2026, 13:18
-
Бизнес Екатерина Лапшина: «У меня всегда был чуть больший аппетит к риску» 07 мая 2026, 16:10
-
Искусственный интеллект Нам не нужен свой OpenAI: где России искать эффект от ИИ и что для этого делать 19 мая 2026, 11:00
-
Бизнес «Команде не вырасти выше лидера»: как изменить неписаные правила взаимодействия в группе 19 мая 2026, 10:00
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Технологии Уроки китайского единства 26 мая 2026, 13:27
-
Технологии Яндекс Пэй разрешил подтверждать подозрительные переводы через доверенное лицо — для защиты от мошенников 02 июня 2026, 19:30
-
Стартапы В Москве прошёл фестиваль Startup Village — стартапы заключили 50 соглашений о запуске проектов в РФ и за рубежом 02 июня 2026, 19:00
-
Технологии 84% российских приложений содержат критические уязвимости — проблемы всё чаще возникают из-за некорректного ИИ-кода 02 июня 2026, 17:10
-
IT Сбои в работе VPN замедляют работу российских разработчиков — многие ИТ-процессы перестали работать автоматически 02 июня 2026, 14:30
-
Россия В России утвердили новые правила подсчёта просмотров в онлайн-кинотеатрах: статистику привяжут к номеру телефона 02 июня 2026, 20:00
-
Бизнес «Аэрофлот» опубликовал финансовые результаты за I квартал 2026 года: чистый убыток группы — 11,9 млрд ₽ 02 июня 2026, 18:05
-
Бизнес «Лента» приобретает гипермаркеты «О’КЕЙ» — вместо прямой оплаты ритейлер примет на себя долговые обязательства сети 02 июня 2026, 16:00
-
Бизнес МТС впервые с 2009 года привлекла кредит от российских банков — сумма займа может достичь 70 млрд ₽ 02 июня 2026, 15:40