«Яндекс» опубликовал нейросеть YaLM 100B — она генерирует и обрабатывает тексты на русском и английском языках. В компании уверяют, что это самая большая GPT-подобная модель, выложенная в свободном доступе.
YaLM 100В содержит 100 млрд параметров.
Языковые модели семейства YaLM определяют принцип построения текста и генерируют новые, основываясь на законах лингвистики и своих знания о мире. Они способны придумывать идеи для рекламных кампаний, описать товары и видео, генерировать стихи, ответы, поздравления и другое, а также классифицировать их.
«Выкладывая YaLM 100B в открытый доступ, мы рассчитываем, что это даст толчок развитию генеративных нейросетей», — сообщил гендиректор «Яндекс.Технологий» Петр Попов, слова которого приводятся в сообщении компании.
Модель была обучена на суперкомпьютерах «Яндекса», в процессе YaLM 100B обработала около 2 ТБ текстов из открытых датасетов и интернета на английском и русском языках.
Модель предоставляется по открытой лицензии Apache 2.0, доступна на GitHub.
Фото на обложке: Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Искусственный интеллект в малом бизнесе: теория и практика»
- 1 «Яндекс» открыл доступ к своей библиотеке YaFSDP
- 2 Разработчик Astra Linux создаст аналог GitLab, GitHub и BitBucket
- 3 «Яндекс» и VK не вошли в список участников эксперимента по созданию «российского GitHub»
- 4 Twitter опубликовал на GitHub часть своего исходного кода
ВОЗМОЖНОСТИ
03 декабря 2024
03 декабря 2024
04 декабря 2024