ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки
Пользователи заметили, что в ответах ChatGPT некоторые слова встречаются гораздо чаще, чем в глобальном интернете. Например, чат-бот часто использует слово delve (углубиться, вникнуть), не особо распространенное в американской и британской версии английского. И это не случайность, а, вероятно, следствие того, как система создавалась.
В конце марта Джереми Нгуен, инфлюенсер в сфере ИИ из Технологического университета Суинберн в Мельбурне, обратил внимание на то, что в своих ответах ChatGPT часто использует слово delve (углубиться, вникнуть). Конечно, если это слово встречается в тексте, это не значит, что он сгенерирован ИИ. Однако в масштабе ситуация совсем другая.
Так, на сайте с биомедицинскими исследованиями PubMed слово delve встречается в 0,5% статей — это в 10-100 раз больше, чем несколько лет назад. А значит, эти статьи могли быть частично написаны с помощью ChatGPT.
Фото в тексте: Джереми Нгуен / X
Однако слово delve — не самое любимое у ChatGPT. Согласно другому набору данных, в его текстах также встречаются чаще, чем в интернете в целом, и некоторые другие слова. Среди них — explore (исследовать), tapestry (гобелен), testament (завет, завещание) и leverage (использовать). И это не случайность, а, вероятно, следствие того, как чат-бот создавался.
Читайте по теме:
60% ответов GPT-3.5 являются плагиатом — исследование
Илон Маск намерен сделать чат-бота Grok политически нейтральным
GPT-4 — это большая языковая модель, которая обучена почти на всех англоязычных текстах в интернете. Чтобы превратить ее в полезный чат-бот, используют метод обучения с подкреплением на основе отзывов людей (reinforcement learning with human feedback, RLHF). Тестировщики-люди задают вопросы и дают инструкции исходной версии модели, а также предоставляют ей фидбек — ставят лайки и дислайки или пишут текстовый ответ.
Такое обучение стоит дорого, поэтому крупные компании передают его на аутсорсинг в менее богатые страны, где можно дешево нанять англоговорящих работников.
Если сравнивать с интернетом в целом, то ChatGPT использует слово delve слишком часто. Однако в африканской части мировой паутины это слово гораздо более распространено.
В Нигерии слово delve используют в деловом английском гораздо чаще, чем в Великобритании и США. Работники, обучающие ИИ, предоставляли ему примеры на привычном языке. В итоге получился чат-бот, который пишет на языке, близком к африканскому английскому.
Фото на обложке: Tada Images /
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Популярное
Материалы по теме
-
Пройти курс «Как открыть пункт выдачи заказов»
- 1 OpenAI: использование ChatGPT усиливает чувство одиночества И снижает социализацию 24 марта 17:46
- 2 «Сбер» выпустил обновленную линейку моделей ИИ GigaChat 2.0 В компании утверждают, что модель является сильнейшим русскоязычным ИИ 13 марта 17:00
- 3 Что такое эмбеддинги и как они работают? Технологии могут анализировать тональность и эмоции в текстах 13 марта 15:19
- 4 Perplexity начал разработку первого «ИИ-смартфона» Он будет стоить до $1 тыс. 03 марта 20:19