Исследователи обнаружили, что лексическое богатство ИИ-переводов гораздо ниже тех, что сделаны человеком
Как это повлияет на язык
Ученые из Тилбургского и Мэрилендского университетов решили оценить, как ИИ переводит тексты, с точки зрения лексического и грамматического разнообразия. Хорошая новость: пока человек справляется с этим лучше, чем алгоритмы. Плохая: машинный перевод может повлиять на человеческий язык.
В ходе исследования было обнаружено, что между обучающими данными, которые получают ИИ-системы, и их переводами присутствует значимая разница. Причина может заключаться в статистической погрешности.
Исследователи изучили ряд различных моделей МО, включая Transformer от Microsoft, нейронный машинный перевод, сети долгой краткосрочной памяти и статистический машинный перевод на основе отдельных фраз. Каждый алгоритм выполнял переводы между английским, французским и испанским языками, а затем исходный текст сравнивался с полученными текстами по девяти показателям.
Результаты показали: независимо от типа модели, в обучающих данных всегда наблюдалось более высокое лексическое разнообразие, чем в машинном переводе.
Другими словами, переводы из набора рекомендаций во всех случаях оказались более разнообразны с точки зрения лексики и синонимов.
По словам участников исследования, потеря лексического разнообразия позволяет упростить и согласовать текст, но может помешать ИИ-системам принимать правильные грамматические решения. Негативный эффект также оказывается на более морфологически богатые языки, такие как испанский и французский.
В статье по проделанной работе ученые написали о том, что в связи с широким распространением систем машинного перевода пришло время изучить влияние этих алгоритмов на человеческий язык: «Если машинный перевод является упрощенной версией обучающих данных, то о чем это говорит с социолингвистической точки зрения и как это повлияет на язык в долгосрочной перспективе?»
Авторы исследования не предлагают решений для обнаруженной проблемы. Однако они надеятся, что полученные показатели вдохновят других на дальнейшее изучение этой темы.
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Интернет-алгоритмы управляют нашей жизнью. Вот как избавиться от их влияния 10 декабря 2020, 18:37
-
Искусственный интеллект Студенты разработали алгоритмы для определения фейковых новостей на фестивале по ИИ и алгоритмическому программированию 07 октября 2020, 14:20
-
Искусственный интеллект Понимающие алгоритмы: зачем бизнесу нужны боты с распознаванием эмоций 17 сентября 2020, 14:34
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Искусственный интеллект Алиса AI — с характером: Яндекс интегрировал в нейросеть ИИ-персонажей с разной манерой общения 19 июня 2026, 11:10
-
Искусственный интеллект Яндекс запустил ИИ-агента, который оформляет командировки: нейросеть подбирает билеты и бронирует гостиницы 18 июня 2026, 17:30
-
Технологии Российский рынок ПО для ИИ вырастет в 4 раза к 2030-му —быстрее всего развиваются платформы для создания ИИ-моделей 17 июня 2026, 18:20
-
Деньги Twinby впервые откроет продажу акций частным инвесторам: минимальный порог входа — 12 тыс. рублей 19 июня 2026, 13:19
-
Бизнес Таксопарки просят разрешить бизнесу использовать иномарки: сейчас квоты на нелокализованные авто есть лишь у физлиц 19 июня 2026, 12:00
-
Россия В России официально появится профессия «Писатель» — уже с 1 сентября 2026 года 18 июня 2026, 16:40
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
-
Бизнес Альфа-Банк подвёл итоги первой программы для импортёров: шесть компаний получили гранты по 1 млн ₽ 15 июня 2026, 18:01