Top.Mail.Ru
Колонки

Машины не восстанут, но вылететь с работы можно: разбираемся, зачем осваивать нейросети

Колонки
Владимир Казаков
Владимир Казаков

Менеджер по продукту бизнес-юнита «Обучение» в «МТС Линк»

Ольга Тройникова

Порядка 50% россиян беспокоятся, что нейросети отнимут у них работу. Мол, если вы не освоите новую профессию, то останетесь не у дел в ближайшие пару лет. Но это далеко от истины. Менеджер по продукту бизнес-юнита «Обучение» «МТС Линк» Владимир Казаков рассказал, на что способны нейросети, а на что нет.

Машины не восстанут, но вылететь с работы можно: разбираемся, зачем осваивать нейросети
  1. Колонки
Автор: Ольга Тройникова

 

Что представляют собой нейросети

В классическом представлении нейросеть — это скопление нейронов. Чем их больше и чем больше между ними связей, тем сложнее сеть и тем более комплексные задачи она может решать. Такие системы могут последовательно обрабатывать и выдавать информацию. 

Благодаря тому, что нейросеть — это не алгоритм с точно заложенными формулами «если…, то…», она может работать с данными, с которыми раньше никогда не сталкивалась. Например, никакой алгоритм не сможет объяснить фразу «Глокая куздра штеко будланула бокра и курдячит бокренка». Но нейросеть может понять, что «некоторая определенным образом характеризуемая сущность женского рода что-то сделала определенным образом с другим существом мужского пола, а затем начала (и продолжает до настоящего момента) делать что-то другое с его детенышем (или более мелким представителем того же вида)». 

Кстати, нейросети часто называют искусственным интеллектом. Но это не совсем корректно: человеческий интеллект способен учиться новому, а нейросеть была однажды обучена и пользуется имеющимися данными как слепком, пока не получит новые. Если упрощать, можно сказать так: ИИ — такой же искусственный интеллект, как машина — искусственная лошадь.

Существует много видов нейросетей, но для удобства мы можем условно разделить их на две группы: специализированные и общие. 

Специализированные нейросети, как правило, более подконтрольны человеку. Чаще всего они нужны для утилитарных функций — их затачивают под конкретные задачи. Примеры повсюду: транскрибация речи в текст, размытие фона и шумоподавление в видеоконференциях, распознавание лиц с помощью камеры телефона. Эти системы призваны облегчить человеческую жизнь. Часто такие нейросети применяют сразу ансамблем — результат из одной нейросети передают в другую, а затем в третью и т. д.

Например, если у вас дома есть умная колонка, она сможет из вашего голоса получить текст (первая нейросеть), затем понять общую суть запроса (вторая нейросеть). Вопросы «какая завтра погода» и «будет ли завтра дождь» нейросеть классифицирует одинаково: скорее всего, она отдаст прогноз погоды в виде шаблонного ответа голосом или выведет стандартный виджет. Но если колонка поймет, что у нее нет готового шаблона, она переключится на общую нейросеть, чтобы сгенерировать ответ с нуля.

Существуют общие нейросети, или General, к которым относится и Generative Pre-trained Transformer (GPT). GPT — это одна из вариаций больших языковых моделей, способная и классифицировать, и генерировать текст, причем очень похожий на созданный человеком. Для этого в саму нейросеть заложили огромное число нейронов и связей, а затем прогнали через нее терабайты текстов. 

GPT — яркий пример, как количество переросло в качество: чтобы натренировать такую модель, требуется колоссальное количество компьютерного времени.


По теме: Как благодаря ChatGPT чат-боты стали интеллектуальными цифровыми ассистентами


 

На что способны нейросети на пороге 2024 года

Чтобы лучше понять, что могут нейросети, предложим одной из них решить детскую задачку.

Собака — 3, Корова — 2, Кукушка — 4, Утка — 3, Овца — 2, Свинья — 3, Петух — 8. Ослик — ?

Знаете ли вы ответ? Верный вариант вы найдете в конце статьи. А пока давайте поймем, почему нейросеть выдала нам такой бред:

Нейросеть обучена продолжать текст. Для этого она берет весь исходный текст, прогоняет его через себя, каждый раз получая ровно одно следующее слово (на самом деле не слово, а токен — символ или несколько символов). Затем она берет снова весь текст, уже вместе с продолжением, и повторяет процесс. И так до тех пор, пока не получит токен, обозначающий конец сообщения, или не упрется в лимит.

Самый важный нюанс: нейросеть не пытается «думать», если ее об этом не попросить. Она пишет наиболее вероятное продолжение. Если мы попросим ее написать ответ и объяснение, она сгенерирует нечто максимально похожее на них. А вот если бы мы предложили ей подумать, она бы писала ответ, похожий на размышления. Каждое слово из этих размышлений снова и снова проходило бы через нейросеть, и это могло бы привести к получению действительно правильного ответа. 

Долгое время я использовал эту загадку как демонстрацию того, что нейросеть не может ответить на некоторые вопросы. Но затем понял, что это я не умел писать инструкции и промты. Как заставить нейросеть выдать верный ответ, мы с вами узнаем в конце статьи, а пока поговорим про ограничения.

 

Машины не восстанут: ограничения и преграды нейросетей

За этот год нейросети проникли во все сферы человеческой деятельности. Но есть несколько «но». У языковых моделей есть лимиты применимости. 

Главная проблема нейросетей — это галлюцинации и сверхисполнительность. Нейросеть неспособна отличить истину от лжи и не справится самостоятельно с поиском конкретного ответа или факта. Выдать ответ для сети критически важно. Неправильно? Не суть. Главное, чтобы пользователь был удовлетворен.

Приведу пример. Попросим нейросеть рассказать, кто утопил Муму.

Почему мы получили такие ответы? Когда нейросеть обучают, через ее нейроны прогоняют терабайты данных, которые превращаются в веса нейронов. Другими словами, данные не сохраняются, а трансформируются в циферки весов, с помощью которых затем нейросеть будет генерировать токен за токеном. Информация преобразуется безвозвратно. Нет возможности ее восстановления в исходном виде.

Вторая проблема — нейросети невыгодно применять в тех задачах, которые быстрее сделать «руками». Иногда написание хорошего промта занимает больше времени, чем самостоятельное решение. Также нейросети плохо помогают с комплексными многоходовыми задачами, которые сначала приходится делить на простые шаги, а потом снова нужно задаться вопросом, не быстрее ли сделать все вручную. 

Нейросеть — это инструмент ограниченной применимости. Нейросеть как молоток: с его помощью можно отлично забивать гвозди и не очень удобно закручивать болты.

Третья проблема — лимит кратковременной памяти, или забывчивость. Весь текст в нейросети превращается в токены, и у этих токенов есть лимит. Если вести с нейросетью диалог, то при каждом новом вашем сообщении она должна «вспомнить» (то есть прогнать через себя) всю историю переписки. Но если вы вышли за пределы лимита токенов, то ей не остается ничего, кроме как удалять самые старые сообщения. А именно там, скорее всего, было описание исходного запроса. То есть через какое-то время разговора нейросеть попросту забывает, с чего все начиналось. 

Дальше нейросеть начинает вести себя как человек, который присоединился к чужому обсуждению где-то в середине и говорит невпопад. Но с этим пытаются бороться. Например, Claude и ChatGPT 4 уже принимают 100 тыс. токенов. Возможно, в 2024 году появятся нейросети, способные обрабатывать 200 тыс. или миллион токенов.

Еще один минус нейросетей — отражение человеческих предрассудков. Чаще всего предубеждения закладываются случайно. Недавнее исследование, проведенное в США, показало, что нейросети часто могут генерировать расистские или сексистские результаты, если они обучались на массиве данных, где уже был какой-то перевес в ту или иную сторону. Например, нейросеть Midjourney на запрос «белый мужчина-грабитель» может выдать изображение темнокожего преступника в белой одежде.

На данном этапе нейросети не могут работать самостоятельно. Им нужен контроль человека. Как автопилоту в Tesla — система управляет автомобилем, но водитель обязан держать руки на руле.

Вот почему маловероятно, что мир захватит профессия «промт-инженер» или то, что нейросети полностью заменят специалистов. Промт-инженер должен не только разбираться, как написать промт, но и очень хорошо понимать саму предметную область. Если не-эксперт обратится за помощью к нейросети, то вряд ли он сможет отфильтровать ее галлюцинации — они бывают крайне правдоподобны.

 

Как нейросети изменят образование

Кажется, быстрое обучение с нейросетью станет своего рода «масс-маркетом». Появляются готовые курсы, написанные нейросетью, а некоторые решения на основе ИИ могут генерировать курсы по заданной теме на лету. 

Важно осознавать, что режим «задать вопрос — получить ответ» — это не совсем образование. Чтобы чему-то научиться у нейросети, надо уметь фильтровать ее галлюцинации. А еще нужно уметь грамотно и подробно формулировать запросы. Как это сделать, если обучаемый — совсем новичок в теме? 

Чтобы получить хороший ответ, я должен заложить в инструкции половину из того, что хочу видеть в ответе. Говорят, «в правильно заданном вопросе содержится половина ответа», и для нейросетей это работает на 200%. 

В отличие от нейросети, преподаватель-человек сможет дать верный ответ даже на неправильно заданный вопрос. Пока я вижу, что нейросети даже повышают ценность живого обучения. Некоторые курсы вешают шильдик «сделано без нейросетей», как на колбасе и сыре с гордостью пишут «без сои и ГМО». Человеку нужен человек.



 

Вместо выводов

Нейросети не заменят человека. И бесполезных профессий нет. Скорее бесполезные кадры заменят полезными. То есть сотрудниками, которые освоят нейросети как механизм помощи в решении повседневных задач. Так же когда-то случилось и с теми, кто освоил условные Excel-таблицы против тех, кто решил не работать с ПК.

Чтобы не остаться на отшибе рынка труда, придется освоить нейросети — это правда. Вряд ли в ближайшем будущем появятся промт-инженеры, которые будут «настраивать» нейросети. Написание промтов станет стандартным навыком. 

Работа с нейросетью — это способ облегчить труд специалисту, а не вытеснить его. Качать интеллектуальную мышцу нужно так же, как и 100–200 лет назад. Разница в том, что в XXI веке такой «спорт» важно адаптировать под социальную цифровизацию.

Но вернемся к загадке. Правильный ответ — 2. Но вот логика решения не совсем тривиальная. Цифры рядом с животными обозначают количество букв в звуках, которые они издают: собака говорит «гав» — 3 буквы, корова говорит «му» — 2 буквы, петух — «кукареку» — 8 и т. д. А вот как можно заставить нейросеть дать верный ответ:

Загадка демонстрирует все основные «провалы» нейросетей, одновременно показывая, что если понимать, откуда и почему возникли эти «провалы», то их можно обойти или использовать в свою пользу. Первый ответ показывает, что нейросеть сверхисполнительна, и поэтому пытается решить задачу во что бы то ни стало. В том числе неправильно. Она пытается считать хвосты, уши. Получается бред. 

Но стоит добавить в промт несколько важных деталей (в данном случае про язык и возраст), объяснить, как вообще нужно подходить к решению таких задач, и нейросеть даст ответ на практически любую загадку.

Фото на обложке: Freepik

Подписывайтесь на наш Telegram-канал, чтобы быть в курсе последних новостей и событий!

Нашли опечатку? Выделите текст и нажмите Ctrl + Enter

Материалы по теме

  1. 1 Карусель нейросетей: что ждет рынок ИИ-стартапов?
  2. 2 За кулисами Sora: как работает видеонейросеть от OpenAI
  3. 3 Копирайтер VS нейросеть: пишем текст и теряем заказчиков
  4. 4 Программирование 2.0: как ИИ-ассистенты упрощают разработку
  5. 5 Руководство по использованию ИИ для повышения KPI команды
ArtTech — карта разработчиков арт-технологий
Все игроки российского рынка технологий для искусства
Перейти