ChatGPT обучали работники из Африки — теперь чат-бот повторяет их языковые привычки
Например, использует слова, не популярные в США и Великобритании
Пользователи заметили, что в ответах ChatGPT некоторые слова встречаются гораздо чаще, чем в глобальном интернете. Например, чат-бот часто использует слово delve (углубиться, вникнуть), не особо распространенное в американской и британской версии английского. И это не случайность, а, вероятно, следствие того, как система создавалась.
В конце марта Джереми Нгуен, инфлюенсер в сфере ИИ из Технологического университета Суинберн в Мельбурне, обратил внимание на то, что в своих ответах ChatGPT часто использует слово delve (углубиться, вникнуть). Конечно, если это слово встречается в тексте, это не значит, что он сгенерирован ИИ. Однако в масштабе ситуация совсем другая.
Так, на сайте с биомедицинскими исследованиями PubMed слово delve встречается в 0,5% статей — это в 10-100 раз больше, чем несколько лет назад. А значит, эти статьи могли быть частично написаны с помощью ChatGPT.
Фото в тексте: Джереми Нгуен / X
Однако слово delve — не самое любимое у ChatGPT. Согласно другому набору данных, в его текстах также встречаются чаще, чем в интернете в целом, и некоторые другие слова. Среди них — explore (исследовать), tapestry (гобелен), testament (завет, завещание) и leverage (использовать). И это не случайность, а, вероятно, следствие того, как чат-бот создавался.
Читайте по теме:
60% ответов GPT-3.5 являются плагиатом — исследование
Илон Маск намерен сделать чат-бота Grok политически нейтральным
GPT-4 — это большая языковая модель, которая обучена почти на всех англоязычных текстах в интернете. Чтобы превратить ее в полезный чат-бот, используют метод обучения с подкреплением на основе отзывов людей (reinforcement learning with human feedback, RLHF). Тестировщики-люди задают вопросы и дают инструкции исходной версии модели, а также предоставляют ей фидбек — ставят лайки и дислайки или пишут текстовый ответ.
Такое обучение стоит дорого, поэтому крупные компании передают его на аутсорсинг в менее богатые страны, где можно дешево нанять англоговорящих работников.
Если сравнивать с интернетом в целом, то ChatGPT использует слово delve слишком часто. Однако в африканской части мировой паутины это слово гораздо более распространено.
В Нигерии слово delve используют в деловом английском гораздо чаще, чем в Великобритании и США. Работники, обучающие ИИ, предоставляли ему примеры на привычном языке. В итоге получился чат-бот, который пишет на языке, близком к африканскому английскому.
Фото на обложке: Tada Images /
-
Партнёрский материал Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 16 июня 2026, 15:52
-
Личное Дарио Амодеи. Как обыграть OpenAI и создать самый дорогой ИИ-стартап в мире 16 июня 2026, 12:05
-
Бизнес Музыкальный бизнес в России в 2026-м: как ИИ и новые законы меняют рынок 19 июня 2026, 18:30
-
Личное Из фарцовщика в создателя дизайн-завода Flacon: как Николай Матушевский дважды бросал свой бизнес и начинал с нуля 05 мая 2026, 12:09
-
Технологии Что сдерживает модернизацию ЖКХ: итоги отраслевой дискуссии на ПМЭФ 09 июня 2026, 12:14
-
Бизнес Отказ от завода и ставка на интеллект: как Катерина Карпова реанимировала PURE LOVE 02 марта 2026, 11:45
-
Технологии Прощание с эпохой Кука и ставка на агентов: конференция Apple WWDC 2026 12 июня 2026, 15:35
-
Искусственный интеллект Как подключить Яндекс Дропс и использовать все функции Алисы AI: полный обзор первых ИИ-наушников от Яндекса 09 июня 2026, 11:00
-
Технологии UMO впервые возглавил рынок электромобилей в России — на бренд пришлось 35% продаж в мае 2026-го 19 июня 2026, 14:42
-
Искусственный интеллект Алиса AI — с характером: Яндекс интегрировал в нейросеть ИИ-персонажей с разной манерой общения 19 июня 2026, 11:10
-
Бизнес Покупательская способность сократилась — без льготной ипотеки россияне могут позволить себе лишь 15 кв. м жилья 19 июня 2026, 21:30
-
Маркетплейсы Яндекс Маркет снизил комиссию для продавцов одежды и обуви — ставка упала более чем втрое 19 июня 2026, 20:45
-
Маркетплейсы Wildberries может открыть премиальный ПВЗ в торговом центре — пункт выдачи будет похож на полноценный магазин 19 июня 2026, 19:15
-
Россия В России стартовали продажи автомобилей Volga — цены начинаются от 2,75 млн рублей 19 июня 2026, 16:05
-
Искусственный интеллект Конференция Conversations от Just AI в Петербурге: VK, Wildberries и другие расскажут, как зарабатывают на ИИ 16 июня 2026, 15:36
-
Реклама Т-Банк будет использовать банковские данные клиентов при показе рекламы — юристы говорят о правовых рисках 10 июня 2026, 14:00
