«Сбер» обучил модель искусственного интеллекта GigaChat Pro распознавать картинки и рукописный текст, чтобы пользователи применяли их в качестве дополнительного контекста к запросу. Об этом рассказали в пресс-службе «Сбера».
«Модель определит, сколько людей на фото, во что они одеты, даст совет по стилю одежды и многое другое», — отметили в пресс-службе кредитной организации.
Кроме распознавания рукописного текста, GigaChat теперь может идентифицировать печатный текст, формулы, графики, таблицы, а также анализировать сведения, которые в них отражены. Это может помочь, например, студентам — они смогут получить краткое содержание конспекта или учебного материала, считают в «Сбере».
Бизнес сможет пользоваться новыми функциями через API (специальный программный интерфейс). Модель сможет придумать описание к товару на основе загруженного пользователем изображения, рассказали в «Сбере».
«Сбер» запустил GigaChat в апреле 2023 года. Помимо прочего, нейросеть может отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и картинки на основе описаний в рамках единого контекста. В сентябре того же года доступ к GigaChat открыли для представителей бизнеса.
Фото на обложке: AP_Graphic /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
ВОЗМОЖНОСТИ
12 ноября 2024
13 ноября 2024