Новости

Яндекс открыл доступ к крупнейшей нейросети в стране — бизнесу дали конструктор ИИ-агентов

Yandex B2B Tech дал доступ к инструменту, который способен изменить правила игры

25 июля 2025, 18:31

На фоне активной кастомизации LLM-сервисов под локальные задачи, Yandex B2B Tech открыл облачный доступ к крупнейшей языковой модели в России — Qwen3-235B. Она уже доступна бизнесу через API и умеет обрабатывать до 256 000 токенов в сессии. По возможностям модель сопоставима с флагманами от OpenAI и DeepSeek AI.

Контекст длиною в 256 тысяч токенов

Yandex B2B Tech открыл облачный доступ к самой большой языковой модели в стране. Модель получила маркировку Qwen3-235B-A22B-Instruct-2507 и уже доступна бизнесу через API в AI Studio. По техническим характеристикам она соответствует, а местами и превосходит международные аналоги от OpenAI и DeepSeek AI. Главное преимущество — огромное контекстное окно на 256 000 токенов, которое позволяет удерживать в памяти массивы информации, делать персонализированные ответы и вести сложные цепочки взаимодействия.

Модель умеет анализировать большие объемы данных в одной сессии, что важно для задач поддержки, генерации рекомендаций или работы с клиентскими кейсами. Она поддерживает 119 языков и диалектов, что делает её применимой в мультинациональных продуктах.

CEO онлайн-университета «Зерокодер» Кирилл Пшинник подтверждает: Qwen3 — не просто маркетинг, это реальный техологический шаг.

«Qwen3‑235B выглядит не как маркетинговый фантик, а как реальный технологический шаг: MoE‑архитектура насчитывает 235 млрд параметров, но активирует лишь часть, что позволяет запускать её на более слабом железе. Более того, Alibaba объединила режимы «мышление» и «быстрый ответ», дав разработчикам настраиваемый thinking budget. [...] В целом воспринимаю Qwen3‑235B как самый убедительный ответ открытого рынка на закрытые GPT‑4‑уровневые решения», — подчеркнул Пшинник.

Агент как сервис: бизнесу открылся быстрый вход в генеративную автоматизацию

Qwen3 можно использовать как основу для создания ИИ-агентов — систем, которые взаимодействуют с клиентами, анализируют вводные и предлагают решения. На базе модели можно собирать:

ассистентов для e-commerce, которые помогают выбрать товар, оформить возврат и решить логистику;
технических агентов для ИТ, способных анализировать ошибки и рекомендовать действия;
внутренние помощники, автоматизирующие рутину и поддержку.

Alibaba уже внедряет таких агентов в своей экосистеме. Теперь аналогичная возможность появилась и у российского бизнеса.

Без железа, но с возможностями: инференс доступен по API

Развёртывание модели такого масштаба требует серьёзной инфраструктуры. Чтобы снять этот барьер, Yandex Cloud сделал модель доступной по подписке через API в AI Studio. Цена — 50 копеек за 1000 токенов.

«Мы предоставляем бизнесу один из самых больших парков моделей в России. При этом гибко адаптируем опенсорс-модели под локальные особенности и задачи, чтобы компании могли безопасно интегрировать нейросети в свои веб-приложения и разрабатывать собственных ИИ-агентов», — отметил Артур Самигуллин, руководитель ML-направления Yandex Cloud.

По мнению Пшинника, для российских пользователей такая модель, развернутая на серверах Яндекса, выглядит как доступный и мощный инструмент: компании могут использовать ее в своих проектах, оставаясь в юридическом контуре Российской Федерации.

Использовать или нет — зависит от задач

По словам Кирилла Пшинника, Qwen3 нельзя назвать универсальной моделью, которую можно брать «по умолчанию» для любых сценариев. Её использование оправдано в тех случаях, когда требуется рассуждение, а не просто быстрый ответ.

«Модель Qwen3 — это модель с рассуждением, а значит, она отвечает медленно и обработка каждого запроса стоит дороже. В большинстве случаев при разработке ассистентов используют модели без рассуждений, чтобы сэкономить токены. Однако если бы стояла задача делать качественные ответы на основе рассуждений — я бы точно рассмотрел эту модель для использования», — подчеркнул он.

По мнению эксперта, для типовых ассистентов чаще выбирают модели полегче — чтобы снизить затраты на инференс и ускорить обработку запроса. Но если нужен осмысленный вывод, Qwen3 стоит рассматривать всерьёз.

Кто уже использует AI Studio

Yandex Cloud AI Studio стала главной точкой входа в генеративные технологии для российского бизнеса. По данным платформы, на ней работают более 44 тысяч компаний, из которых свыше 17 тысяч уже применяют YandexGPT в продуктах и процессах. По словам Кирилла Пшинника, Studio не просто предоставляет доступ к языковым моделям, а объединяет ключевые ИИ-сервисы Яндекса в едином интерфейсе:

«Yandex Cloud AI Studio уже стала точкой входа в ИИ для российского бизнеса: в целом на Yandex Cloud работают более 44 тыс. компаний, из них свыше 17 тыс. уже используют языковую модель YandexGPT. А доля ИИ‑сервисов в выручке платформы выросла до 5% и прогнозно поднимется до 8% к концу года», — поделился статистикой Пшинник.

Он уточняет, что клиенты используют платформу не только для генерации текста, но и для построения полноценной автоматизации — от чат-ботов до голосовых ассистентов и систем анализа данных:

«Сама AI Studio объединяет эти сервисы, и, по данным компании, ей доверяют «тысячи клиентов», которые через единый интерфейс собирают чат-ботов, голосовых роботов и системы анализа текста. Среди публичных кейсов — Яндекс Маркет генерирует до 10 000 описаний товаров в день, Skyeng обрабатывает 30 000 звонков в неделю, а Fix Price автоматизировал приглашение на собеседование 15 000 кандидатов», — подытожил он.

Что это меняет

Яндекс снял главный барьер для внедрения масштабных LLM в российский B2B. Теперь любой бизнес может строить ИИ-агентов на модели GPT-класса, не закупая железо и не нарушая регуляторных требований. Qwen3-235B — это не демо, а реально доступный инструмент. И если сейчас его берут для пилотов, то следующий шаг — массовые внедрения, особенно там, где важна юридическая локализация и стоимость обработки запроса.

Фото: Adi Goldstein / Unsplash

Подписывайтесь на наш Telegram-канал

Материалы по теме

1 По секрету — всему интернету: переписки с ChatGPT теперь попадают в поисковую выдачу Google Пользователи делятся ссылками на разговоры с ИИ — а их чаты появляются в поисковике 31 июля 2025, 18:37
2 Вместо друзей и психологов — чат-боты: в России стали в 5 раз чаще разговаривать с ИИ Чат с виртуальным другом — новый способ справиться с тревогой и одиночеством 30 июля 2025, 19:04
3 Чат с ChatGPT — не исповедь: создатель OpenAI предупредил, что конфиденциальности в переписке с ИИ нет Переписка с ChatGPT может даже стать уликой — и её могут использовать в суде 30 июля 2025, 16:00
4 15 секунд VS 18 минут: Мосбиржа создала внутренний ИИ-поисковик для ускорения работы в 72 раза Он уже стал частью ИИ-экосистемы, следующий шаг — персональный голосовой ассистент 28 июля 2025, 11:35