Яндекс открыл доступ к крупнейшей нейросети в стране — бизнесу дали конструктор ИИ-агентов
На фоне активной кастомизации LLM-сервисов под локальные задачи, Yandex B2B Tech открыл облачный доступ к крупнейшей языковой модели в России — Qwen3-235B. Она уже доступна бизнесу через API и умеет обрабатывать до 256 000 токенов в сессии. По возможностям модель сопоставима с флагманами от OpenAI и DeepSeek AI.
Контекст длиною в 256 тысяч токенов
Yandex B2B Tech открыл облачный доступ к самой большой языковой модели в стране. Модель получила маркировку Qwen3-235B-A22B-Instruct-2507 и уже доступна бизнесу через API в AI Studio. По техническим характеристикам она соответствует, а местами и превосходит международные аналоги от OpenAI и DeepSeek AI. Главное преимущество — огромное контекстное окно на 256 000 токенов, которое позволяет удерживать в памяти массивы информации, делать персонализированные ответы и вести сложные цепочки взаимодействия.
Модель умеет анализировать большие объемы данных в одной сессии, что важно для задач поддержки, генерации рекомендаций или работы с клиентскими кейсами. Она поддерживает 119 языков и диалектов, что делает её применимой в мультинациональных продуктах.
CEO онлайн-университета «Зерокодер» Кирилл Пшинник подтверждает: Qwen3 — не просто маркетинг, это реальный техологический шаг.
«Qwen3‑235B выглядит не как маркетинговый фантик, а как реальный технологический шаг: MoE‑архитектура насчитывает 235 млрд параметров, но активирует лишь часть, что позволяет запускать её на более слабом железе. Более того, Alibaba объединила режимы «мышление» и «быстрый ответ», дав разработчикам настраиваемый thinking budget. [...] В целом воспринимаю Qwen3‑235B как самый убедительный ответ открытого рынка на закрытые GPT‑4‑уровневые решения», — подчеркнул Пшинник.
Агент как сервис: бизнесу открылся быстрый вход в генеративную автоматизацию
Qwen3 можно использовать как основу для создания ИИ-агентов — систем, которые взаимодействуют с клиентами, анализируют вводные и предлагают решения. На базе модели можно собирать:
- ассистентов для e-commerce, которые помогают выбрать товар, оформить возврат и решить логистику;
- технических агентов для ИТ, способных анализировать ошибки и рекомендовать действия;
- внутренние помощники, автоматизирующие рутину и поддержку.
Alibaba уже внедряет таких агентов в своей экосистеме. Теперь аналогичная возможность появилась и у российского бизнеса.
Без железа, но с возможностями: инференс доступен по API
Развёртывание модели такого масштаба требует серьёзной инфраструктуры. Чтобы снять этот барьер, Yandex Cloud сделал модель доступной по подписке через API в AI Studio. Цена — 50 копеек за 1000 токенов.
«Мы предоставляем бизнесу один из самых больших парков моделей в России. При этом гибко адаптируем опенсорс-модели под локальные особенности и задачи, чтобы компании могли безопасно интегрировать нейросети в свои веб-приложения и разрабатывать собственных ИИ-агентов», — отметил Артур Самигуллин, руководитель ML-направления Yandex Cloud.
По мнению Пшинника, для российских пользователей такая модель, развернутая на серверах Яндекса, выглядит как доступный и мощный инструмент: компании могут использовать ее в своих проектах, оставаясь в юридическом контуре Российской Федерации.
Использовать или нет — зависит от задач
По словам Кирилла Пшинника, Qwen3 нельзя назвать универсальной моделью, которую можно брать «по умолчанию» для любых сценариев. Её использование оправдано в тех случаях, когда требуется рассуждение, а не просто быстрый ответ.
«Модель Qwen3 — это модель с рассуждением, а значит, она отвечает медленно и обработка каждого запроса стоит дороже. В большинстве случаев при разработке ассистентов используют модели без рассуждений, чтобы сэкономить токены. Однако если бы стояла задача делать качественные ответы на основе рассуждений — я бы точно рассмотрел эту модель для использования», — подчеркнул он.
По мнению эксперта, для типовых ассистентов чаще выбирают модели полегче — чтобы снизить затраты на инференс и ускорить обработку запроса. Но если нужен осмысленный вывод, Qwen3 стоит рассматривать всерьёз.
Кто уже использует AI Studio
Yandex Cloud AI Studio стала главной точкой входа в генеративные технологии для российского бизнеса. По данным платформы, на ней работают более 44 тысяч компаний, из которых свыше 17 тысяч уже применяют YandexGPT в продуктах и процессах. По словам Кирилла Пшинника, Studio не просто предоставляет доступ к языковым моделям, а объединяет ключевые ИИ-сервисы Яндекса в едином интерфейсе:
«Yandex Cloud AI Studio уже стала точкой входа в ИИ для российского бизнеса: в целом на Yandex Cloud работают более 44 тыс. компаний, из них свыше 17 тыс. уже используют языковую модель YandexGPT. А доля ИИ‑сервисов в выручке платформы выросла до 5% и прогнозно поднимется до 8% к концу года», — поделился статистикой Пшинник.
Он уточняет, что клиенты используют платформу не только для генерации текста, но и для построения полноценной автоматизации — от чат-ботов до голосовых ассистентов и систем анализа данных:
«Сама AI Studio объединяет эти сервисы, и, по данным компании, ей доверяют «тысячи клиентов», которые через единый интерфейс собирают чат-ботов, голосовых роботов и системы анализа текста. Среди публичных кейсов — Яндекс Маркет генерирует до 10 000 описаний товаров в день, Skyeng обрабатывает 30 000 звонков в неделю, а Fix Price автоматизировал приглашение на собеседование 15 000 кандидатов», — подытожил он.
Что это меняет
Яндекс снял главный барьер для внедрения масштабных LLM в российский B2B. Теперь любой бизнес может строить ИИ-агентов на модели GPT-класса, не закупая железо и не нарушая регуляторных требований. Qwen3-235B — это не демо, а реально доступный инструмент. И если сейчас его берут для пилотов, то следующий шаг — массовые внедрения, особенно там, где важна юридическая локализация и стоимость обработки запроса.
Фото: Adi Goldstein / Unsplash
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Налог на прибыль организаций
Материалы по теме
-
Пройти курс «Наличка: как использовать, чтобы не нарушить 115-ФЗ»
- 1 21 млрд на нейросетях: у «Авито» появилась должность директора по ИИ Задача руководства — распространить нейросети на все процессы сервиса 25 июля 13:09
- 2 Маск хочет вложить деньги Tesla в xAI — а решение снова перекладывает на инвесторов Финансирование стартапа Маска снова выносится на голосование — как в 2016-м с SolarCity 24 июля 18:56
- 3 От генеративных моделей до автономных лабораторий — ИИ меняет не только бизнес, но и фундаментальную науку ИИ-роботы освобождают учёных от рутинной и опасной работы 23 июля 18:59
- 4 В Сбер теперь не берут без AI — кандидатам включили генеративный фильтр Нейросети стали новой грамотностью: работать с ИИ нужно почти всем, кто приходит в команду 23 июля 14:49