Переводя Lorem Ipsum он выдает NATO и Китай
Репортер Брайан Кребс, занимающийся интернет-безопасностью, обнаружил странный баг в Google Translate, о чем написал в своем блоге. Пару месяцев назад ему прислал письмо глава кибербезопасности в Deloitte, который с коллегами заметил занятный паттерн в переводчике: если забить туда латинский текст «Lorem Ipsum», которым заполняют свои вебстраницы дизайнеры, то перевод получается крайне интересный — Китай.
Если сделать буквы заглвными, то получалось НАТО, акроним для организации Североатлантического договора. Перевод в верхний и нижний регистры давали “The Internet” и “The Company” (это уже устоявшаяся кодовая фраза для U.S. Central Intelligence Agency, или ЦРУ). Различные комбинации с повтором слов и перестановкой давали еще более странные результаты.
lorem ipsum ipsum ipsum Lorem — China is very very sexy
У исследователей сразу возникли теории заговора. Кто-то вне Google хакнул переводчик и привязал определенный смысл к определенным запросам в Google Translate? Это секретный канал связи? Или способ для кого-то обходить Великий файерволл Китая?
Сам Кребс не исключает большой вероятности, что это просто глитч в машинном обучении — у алгоритма просто нет новых документов на латинском, чтобы брать из них языковые формы.
А вот исследователь машинного обучения в Университете Вашингтона считает, что это не случайность. Он упоминает, что Google, в принципе, можно научить «говорить» вашим шифром, если скормить ему огромный массив подобного текста и заставить переводчик извлекать информацию оттуда:
Такие вещи не происходят сами по себе. Моя догадка — здесь произошло что-то преднамеренное.
Еще до того как Кребс закончил свой отчет, Google изменил алгоритм так, что эти комбинации уже не выдавались. Теперь на слово lorem переводчик просто выводит lorem обратно.
В любом случае, мы может никогда не получить правдивого объяснения. В полночь 16 августа Google Translate резко перестал переводить слово lorem во что-то кроме lorem с латинского на английский. Однако переводчик до сих пор выдает интересные результаты при переводе латинского на английский.
Google с юмором ответил в Twitter на догадки по поводу таинственного шифра:
@TechCrunch @johnbiggs Don't worry, Translate is safe. But when you try to translate nonsense, ouyay etgay onsensenay.
— A Googler (@google) 18 августа 2014
А вы как думаете, могло ли ЦРУ деlorem lorem ipsum china putin?1
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- 1 Codenrock проводит ML-соревнование по разработке модели, которая может отличать текст ИИ от текста человека
- 2 Стартует онлайн-чемпионат по анализу данных с призовым фондом 1 млн рублей
- 3 «VK Клипы» представил новую функцию для мгновенного подбора коротких видео под настроение
- 4 Куда движутся «облака» в России: три долгосрочных тренда на рынке
- 5 Конференция Data Fusion 2023 по машинному обучению, анализу данных и технологиям ИИ пройдет 13-14 апреля
ВОЗМОЖНОСТИ
10 июня 2023
11 июня 2023
11 июня 2023