ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки
Например, использует слова, не популярные в США и Великобритании
Пользователи заметили, что в ответах ChatGPT некоторые слова встречаются гораздо чаще, чем в глобальном интернете. Например, чат-бот часто использует слово delve (углубиться, вникнуть), не особо распространенное в американской и британской версии английского. И это не случайность, а, вероятно, следствие того, как система создавалась.
В конце марта Джереми Нгуен, инфлюенсер в сфере ИИ из Технологического университета Суинберн в Мельбурне, обратил внимание на то, что в своих ответах ChatGPT часто использует слово delve (углубиться, вникнуть). Конечно, если это слово встречается в тексте, это не значит, что он сгенерирован ИИ. Однако в масштабе ситуация совсем другая.
Так, на сайте с биомедицинскими исследованиями PubMed слово delve встречается в 0,5% статей — это в 10-100 раз больше, чем несколько лет назад. А значит, эти статьи могли быть частично написаны с помощью ChatGPT.
Фото в тексте: Джереми Нгуен / X
Однако слово delve — не самое любимое у ChatGPT. Согласно другому набору данных, в его текстах также встречаются чаще, чем в интернете в целом, и некоторые другие слова. Среди них — explore (исследовать), tapestry (гобелен), testament (завет, завещание) и leverage (использовать). И это не случайность, а, вероятно, следствие того, как чат-бот создавался.
Читайте по теме:
60% ответов GPT-3.5 являются плагиатом — исследование
Илон Маск намерен сделать чат-бота Grok политически нейтральным
GPT-4 — это большая языковая модель, которая обучена почти на всех англоязычных текстах в интернете. Чтобы превратить ее в полезный чат-бот, используют метод обучения с подкреплением на основе отзывов людей (reinforcement learning with human feedback, RLHF). Тестировщики-люди задают вопросы и дают инструкции исходной версии модели, а также предоставляют ей фидбек — ставят лайки и дислайки или пишут текстовый ответ.
Такое обучение стоит дорого, поэтому крупные компании передают его на аутсорсинг в менее богатые страны, где можно дешево нанять англоговорящих работников.
Если сравнивать с интернетом в целом, то ChatGPT использует слово delve слишком часто. Однако в африканской части мировой паутины это слово гораздо более распространено.
В Нигерии слово delve используют в деловом английском гораздо чаще, чем в Великобритании и США. Работники, обучающие ИИ, предоставляли ему примеры на привычном языке. В итоге получился чат-бот, который пишет на языке, близком к африканскому английскому.
Фото на обложке: Tada Images /
-
Партнёрский материал Экс-директор Xiaomi о том, как делать сильные продукты и внедрять ИИ без иллюзий 06 апреля 2026, 16:14
-
Технологии Александр Пьянов, «Яндекс Драйв»: «Мы готовы стать агрегатором для всего рынка каршеринга» 08 апреля 2026, 12:26
-
Банки Ирина Лебедева, Т2: «Ключевой принцип — без неприятных сюрпризов» 25 марта 2026, 09:14
-
Искусственный интеллект «Идея „ИИ всех заменит“ похожа на мыльный пузырь». Прогноз на 2026 год от специалиста по будущему 24 декабря 2025, 11:29
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Бизнес Анна Симакова: «В кризис выживают крупные структуры» 20 февраля 2026, 10:06
-
Бизнес «Точно розовый?»: как Eburet из табурета-трансформера вырос в B2B-бренд, который заходит на рынок в 50 млрд ₽ 11 февраля 2026, 19:48
-
Личное Евгений Касперский: «От пароля „123“ мы не спасаем. Но есть и хорошие новости» 04 февраля 2026, 12:35
-
Искусственный интеллект Nebius Аркадия Воложа ведёт переговоры о покупке ИИ-стартапа AI21 Labs — ранее проект оценили в $1,4 млрд 09 апреля 2026, 20:35
-
Искусственный интеллект В России выпустят ИИ-мультсериалы по текстам Эдуарда Успенского — нейросети помогут снизить стоимость производства 09 апреля 2026, 13:39
-
Искусственный интеллект Wildberries запустила ИИ-примерку косметики — пока нейросеть умеет наносить на фото только помаду и блёстки 08 апреля 2026, 13:34
-
Бизнес Мосбиржа начала маркировать акции компаний, не раскрывающих данные о себе: отметку получили «Мосэнерго» и «Роснано» 09 апреля 2026, 17:29
-
Россия В работе «Ростелекома» произошёл масштабный сбой из-за DDoS-атаки — пользователи жалуются на проблемы с интернетом 06 апреля 2026, 23:59
-
Бизнес В Москве проходит форум о целевых капиталах: бизнес обсуждает финансовую устойчивость НКО и их будущее 03 апреля 2026, 14:17
-
Ритейл «Купер» запустил программу лояльности: малый и средний бизнес сможет вернуть 1,5% с закупок 31 марта 2026, 11:35
-
Россия В России средний чек на туры вырос с 60 тыс. до 93 тыс. рублей, а ОАЭ не теряют популярности у российских туристов 30 марта 2026, 20:14
