«Яндекс» выложил в опенсорс масштабный датасет Yambda
Для улучшения рекомендательных систем
«Яндекс» открыл доступ к Yambda (Yandex music billion-interactions dataset) — одному из крупнейших в мире датасетов, предназначенных для разработки рекомендательных систем. Об этом Русбейс рассказали в компании.
Ресурс позволит ученым и исследователям со всего мира тестировать и совершенствовать алгоритмы рекомендаций. Датасет представлен в трех вариантах: полная версия содержит 5 млрд данных, а сокращенные — 500 млн и 50 млн записей, что дает возможность выбрать наиболее подходящий для конкретных задач вариант в зависимости от наличия вычислительных ресурсов. Данные доступны на HuggingFace, а код для их оценки — на GitHub.
«Рекомендательные алгоритмы помогают людям находить нужные товары, фильмы, музыку и многое другое. Развитие этих алгоритмов напрямую зависит от научных исследований, для которых нужны качественные и объемные датасеты», — отмечает Александр Плошкин, руководитель направления по развитию качества персонализации в «Яндексе». Он подчеркивает, что публикация больших открытых датасетов, таких как Yambda, устраняет разрыв между академическими исследованиями и потребностями бизнеса.
- Yambda создан на основе анонимизированных данных «Яндекс Музыки» и включает агрегированные прослушивания, лайки и дизлайки. Все пользовательские данные защищены, поскольку датасет содержит лишь числовые идентификаторы, что обеспечивает конфиденциальность и безопасность.
Фото на обложке: Miha Creative / Shutterstock / FOTODOM
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Деньги Ключевая ставка ЦБ РФ в 2026 году: текущий показатель и как он влияет на экономику 23 апреля 2026, 20:19
-
Тренды Туры на 1 и 9 Мая 2026 года: куда поехать, какие есть форматы и сколько стоит 18 апреля 2026, 12:00
-
Ритейл Когда ручная отчётность мешает компании расти: как ускорить аналитику в фешен-ретейле 16 апреля 2026, 18:29
-
Личное «Успешным я стану, продав бизнес и уехав в Африку реабилитировать горилл». Интервью с ресторатором Денисом Бобковым 10 апреля 2026, 17:00
-
IT Мессенджер imo в России в 2026 году: где скачать, как установить и начать пользоваться 09 апреля 2026, 19:38
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Бизнес Анна Симакова: «В кризис выживают крупные структуры» 20 февраля 2026, 10:06
-
Искусственный интеллект МТС начал выпуск модульных дата-центров: бизнес сможет обрабатывать данные уже на начальном этапе строительства ЦОД 27 апреля 2026, 17:10
-
Искусственный интеллект Банки просят отложить регулирование ИИ до 2028–2029 годов — закон может ограничить развитие финансовых сервисов 27 апреля 2026, 16:30
-
Бизнес Бизнес теряет из-за пропущенных звонков до 96 млн ₽ в год: наибольшую выручку упускают стоматологии и автосервисы 27 апреля 2026, 18:25
-
Бизнес Кадровый манёвр: аэропорт «Домодедово» возглавил топ-менеджер из «Шереметьево» — после продажи актива за 66 млрд ₽ 27 апреля 2026, 15:45
-
Реклама «Яндекс» запускает рекламу в Max: монетизация доступна для каналов с аудиторией от 1000 подписчиков 27 апреля 2026, 14:51
-
Ритейл Лэтуаль закроет 150 магазинов по всей России: ранее сеть получила убыток более 1 млрд ₽ — впервые за 12 лет 27 апреля 2026, 12:02
-
Бизнес Тим Кук покидает пост CEO Apple — его преемником станет главный инженер компании Джон Тернус 21 апреля 2026, 00:07