Google запустила проект Everyday Robots с целью создать универсального робота на базе ИИ, который будет жить и работать вместе с людьми. Команду поощряли мыслить как можно более креативно — ей удалось научить машины автономно убираться и даже импровизировать в танцах.
Бывший вице-президент проекта Ганс Петер Брондмо рассказал изданию Wired о «внутренней кухне». Приводим пересказ этого материала.
Содержание:
- Что представлял собой проект X
- Почему так сложно создать тело для ИИ
- Как обучают роботов
- Поворотный момент на «ферме рук»
- Роботам нужно очень много данных
- Должны ли машины выглядеть как люди?
- Роботы-уборщики столов
- Танцующие машины
- Это только начало
- Роботы — необходимость для некоторых стран
Что представлял собой проект X
Проект Google X, известный как Everyday Robots, был запущен в 2010 году. В основе лежала идея о том, что Google способна решить некоторые из сложнейших проблем в мире.
Команду намеренно разместили в отдельном здании в нескольких милях от главного кампуса — она должна была развивать свою культуру и мыслить как можно более нестандартно. Немало сил было вложено в то, чтобы побудить участников принимать большие риски, быстро экспериментировать и даже радоваться неудачам — как показателю того, что команда установила крайне высокую планку.
Когда Брондмо присоединился к проекту, уже велась работа над Waymo, Google Glass и другими научно-фантастическими идеями (среди них — летающие энергетические ветряные мельницы и стратостаты, которые предоставят доступ к интернету недостаточно обслуживаемым районам).
От стартапов Кремниевой долины проекты X отличались тем, насколько масштабно и долгосрочно сотрудников побуждали мыслить. Проект должен был соответствовать специальной «формуле»:
- решать проблему, которая затрагивает сотни миллионов или даже миллиарды людей;
- использовать прорывную технологию, которая позволяет решить проблему по-новому;
- предлагать радикальное решение для бизнеса или продукта, которое может казаться безумным (в хорошем смысле этого слова).
Почему так сложно создать тело для ИИ
Проектом X руководил Астро Теллер, и, как утверждает Брондмо, трудно представить человека, более подходящего на эту роль. Астро появлялся в офисе только на роликах, а собранные в хвост волосы, дружелюбная улыбка и необычное имя делали его похожим на персонажа из сериала HBO «Кремниевая долина».
Брондмо рассказывает: «Когда мы с Астро впервые обсуждали, как поступить с девятью компаниями-производителями роботов, приобретенными Google, мы решили, что что-то нужно сделать. Но что?» На тот момент большинство полезных роботов были большими, глупыми и опасными. Их использовали на заводах и складах, и их часто нужно было строго контролировать или помещать в клетки, чтобы защитить от них людей.
Фото в тексте: Ганс Петер Брондмо
Как создать роботов, полезных и безопасных в повседневных условиях? Потребуется новый подход. Такие машины должны были решить проблему старения населения, а также сокращения и нехватки рабочей силы. Еще в 2016 году команда понимала, что прорывной технологией станет ИИ. Радикальное решение: полностью автономные роботы, которые будут помогать нам в повседневной жизни.
Другими словами, команда собиралась создать для ИИ физическое тело. Брондмо был убежден, что что-то такого масштаба может быть создано именно в X. Для этого нужно много времени и терпения, готовность пробовать безумные идеи и терпеть неудачу во многих из них. Это требует значительных технических прорывов в области ИИ и робототехники и, скорее всего, обойдется в миллиарды долларов.
Члены команды были глубоко убеждены: слияние ИИ и робототехники неизбежно — нужно лишь заглянуть за горизонт возможного. Всем казалось, что многое из того, что существовало только в научной фантастике, вот-вот станет реальностью.
В команду X входил Джефф Бингем, у которого была докторская степень в области биоинженерии и репутация человека, способного предложить глубокие инсайты по любой теме. Бингем назвал робототехнику «системной проблемой». Он хотел подчеркнуть: робот — очень сложная система, и она хороша лишь настолько, насколько хороша ее самая слабая часть.
- Если подсистеме зрения трудно воспринимать объекты под прямыми солнечными лучами, то в солнечный день робот может внезапно ослепнуть и перестать работать.
- Если подсистема навигации не распознает лестницы, робот может упасть, покалечив себя и окружающих.
И это лишь несколько примеров. Сложно создать робота, который сможет жить и работать вместе с нами.
Десятилетиями люди пытались запрограммировать различные виды роботов, чтобы те выполняли простые задачи, например брали чашку со стола или открывали дверь. Однако при малейших изменениях эти программы всегда давали сбой. Проблема — в непредсказуемости реального мира. И это еще не так сложно, как, например, перемещаться по неорганизованных и загроможденным пространствам, где мы живем и работаем.
Если только не поместить все объекты в определенные места и не поддерживать одинаковое освещение, то невыполнимой станет даже такая простая задача, как взять, к примеру, зеленое яблоко и положить его в стеклянную миску на кухонном столе. Вот почему заводских роботов держат в клетках. Их окружение предсказуемо, и им не нужно беспокоиться о том, что они ударят человека по голове.
Как обучают роботов
Ларри Пейдж говорил, что для создания роботов, которые будут жить и работать вместе с нами, нужно всего 17 специалистов по машинному обучению. Почему именно это число?
Если говорить кратко, есть два подхода к применению ИИ в робототехнике.
Гибридный подход — разные части системы работают на базе ИИ, а затем соединяются с помощью традиционного программирования.
При таком подходе подсистема зрения использует ИИ, чтобы распознавать и присваивать категории окружающему миру. Когда она создает список видимых объектов, программа робота получает этот список и действует на его основе, используя алгоритмы, реализованные в коде.
Если программа указывает взять яблоко со стола, то яблоко будет обнаружено системой зрения на базе ИИ, а программа выберет из списка объект типа «яблоко» и потянется к нему, используя традиционное ПО для управления роботом.
Фото в тексте: Ганс Петер Брондмо
Сквозное обучение (end-to-end learning, e2e) — направлено на изучение целых задач, таких как «поднятие объекта», и даже более комплексных, например «уборка стола».
Роботам предоставляют огромный объем обучающих данных — подобно тому, как человек учится выполнять физическую задачу. Если попросить ребенка поднять чашку, в зависимости от возраста ему может потребоваться узнать, что такое чашка, что в ней может быть жидкость, а также неоднократно опрокинуть ее или, по крайней мере, пролить много молока. Но наблюдая за другими, подражая им и практикуясь, он учится это делать и даже не задумывается о выполненных шагах.
Брондмо пришел к выводу, что Пейдж имел в виду следующее: ничто не имело значения, пока команда не продемонстрирует, что роботы могут научиться выполнять комплексные задачи. Только тогда появится реальный шанс создать машины, способные выполнять эти задачи в запутанном и непредсказуемом реальном мире. Дело не в конкретном числе 17, а в том, что для больших прорывов нужны маленькие команды, а не армии инженеров.
Поворотный момент на «ферме рук»
Питер Пастор, получивший докторскую степень по робототехнике в Университете Южной Калифорнии, проводил много времени в лаборатории, возясь с 14 разработанными там же механическими руками, которых позже заменили 7 промышленными роборуками Kuka. Команда окрестила это «фермой рук».
Эти руки работали круглосуточно, постоянно пытаясь поднять из корзины предметы вроде губок, кубиков Lego, резиновых утят и пластиковых бананов. Изначально роборуки запрограммировали на то, чтобы из случайного положения сверху перемещать захват в корзину, закрывать и поднимать его, а затем проверять, достали ли они что-нибудь. Над корзиной находилась камера, которая фиксировала содержимое, движение руки и ее успех или неудачу. Это продолжалось месяцами.
Фото в тексте: Ганс Петер Брондмо
В начале роботы справлялись только в 7% случаев. С каждым успехом они получали положительное подкрепление (так называемые «веса» в нейронной сети, используемые для определения различных результатов, корректируются для положительного подкрепления желаемого поведения и отрицательного подкрепления нежелательного). В конечном итоге эти руки научились успешно подбирать предметы более чем в 70% случаев.
Как рассказал Брондмо, однажды Питер показал ему видео, на котором рука робота не просто тянулась за желтым блоком Lego, а убирала с пути другие предметы, чтобы схватить именно его. Это стало поворотным моментом. Робот не был явно запрограммирован на это движение. Он научился это делать.
Читайте по теме:
Ученые создали роботизированную ногу с искусственными мышцами
Ученые придумали, как управлять роботом с помощью гриба
В «Сбере» назвали сроки выпуска человекоподобного робота
Но факт остается фактом: семь роботов потратили несколько месяцев, чтобы научиться поднимать резинового утенка. Слишком долго. Чтобы ускорить процесс, команда построила облачный симулятор и в 2021 году создала в нем более 240 млн экземпляров роботов.
Симулятор напоминает гигантскую видеоигру с моделью физики реального мира, достаточно реалистичной, чтобы имитировать вес предмета и трение поверхности. Тысячи моделируемых роботов выполняли такие задачи, как взять чашку со стола, используя ввод с моделируемой камеры и моделируемые тела, созданные по образцу реальных машин.
Эти роботы одновременно пытались и терпели неудачу миллионы раз, собирая данные для обучения алгоритмов ИИ. Когда они стали довольно хорошо справляться в симуляции, алгоритмы перенесли в физических роботов, чтобы те выполнили новые движения в реальном мире.
Роботам нужно очень много данных
Потребуется огромный объем информации, чтобы научить роботов автономно жить и работать вместе с нами. Даже с симуляциями и другими способами создать обучающие данные роботы вряд ли когда-нибудь начнут работать на базовой модели, которая контролирует всю систему.
Все еще неясно, насколько сложные задачи способны освоить машины с помощью одного только ИИ. По мнению Брондмо, тысячам или даже миллионам роботов нужно будет обучаться в реальном мире, чтобы собрать достаточно данных для сквозного обучения моделей, которые позволят выполнять не только четко определенные задачи.
Фото в тексте: Ганс Петер Брондмо
Для создания полезных роботов, которые, к примеру, убирают столы в ресторане или заправляют кровати в отеле, еще долгое время будет требоваться как ИИ, так и традиционное программирование. Другими словами, не ждите, что в ближайшее время роботы выйдут из-под контроля и начнут делать то, на что не были запрограммированы.
Должны ли машины выглядеть как люди?
Брондмо считает, что роботы не должны просто подражать нам. В этом он убедился на встрече с техническими руководителями Everyday Robots. Участники сидели за столом переговоров и оживленно обсуждали, должны ли у роботов быть ноги или колеса. Одна из сторон предложила хороший аргумент: места, где мы живем и работаем, приспособлены к нам, а у нас есть ноги. Так что, возможно, они должны быть и у роботов.
Спустя полчаса Винсент Дюро, самый старший инженер в зале, сказал: «Я думаю, что если я могу куда-то добраться, то смогут и роботы». Винсент сидел в инвалидном кресле. В помещении воцарилась тишина. Дискуссия была окончена.
Правда в том, что ноги робота механически и электронно очень сложны. Они двигаются не очень быстро, делают робота неустойчивым и менее энергоэффективны по сравнению с колесами. По мнению Брондмо, не стоит стремится к подражанию — этот принцип можно использовать и в других дизайнах.
Команда Everyday Robots стремилась максимально упростить строение роботов, ведь чем раньше они смогут выполнять реальные задачи, тем быстрее получится собрать ценные данные.
Роботы-уборщики столов
Брондмо рассказывает: «Я сидел за столом, когда один из наших одноруких роботов с головой в форме прямоугольника с закругленными углами подъехал, обратился ко мне по имени и спросил, может ли он прибраться. Я сказал “да” и отошел в сторону».
«За несколько минут он собрал пару пустых бумажных стаканчиков, прозрачный стаканчик для чая со льдом из Starbucks и пластиковую обертку от батончика Kind. Он бросил эти предметы в лоток для мусора, прикрепленный к его основанию, а затем повернулся ко мне, кивнул и направился к следующему столу».
Роботы использовали ИИ, чтобы видеть людей и предметы — это показывало, что команда добилась значительного прогресса.
Фото в тексте: Ганс Петер Брондмо
Бенджи Холсон, инженер-программист и бывший кукловод, который возглавлял команду, создавшую этих роботов-уборщиков, был сторонником гибридного подхода. Он не выступал против сквозного обучения, но был нацелен заставить машины делать что-то полезное прямо сейчас. Если исследователи в области МО решали какую-то задачу по сквозному обучению лучше, чем его команда могла ее запрограммировать, они просто добавляли больше алгоритмов.
Хотя Брондмо привык к уборщикам-машинам, им по-прежнему удивлялись и радовались посетители и новые сотрудники. «Их взгляд напоминал мне, насколько это было ново», — рассказывает он.
Танцующие машины
Консультантами для Everyday Robots были философ, антрополог, бывший лидер профсоюза, историк и экономист. С ними члены команды обсуждали экономические, социальные и философские вопросы. Например:
- Если роботы начнут жить вместе с нами, каковы будут экономические последствия?
- Какое долгосрочное и краткосрочное влияние это окажет на рынок труда?
- Что значит быть человеком в эпоху умных машин?
- Как создавать эти машины таким образом, чтобы мы чувствовали себя комфортно и в безопасности?
В 2019 году Брондмо познакомился с Кэти Куан, которая училась на докторскую степень по робототехнике и ИИ в Стэнфорде и при этом была профессиональной танцовщицей. Команде нужен был человек, который будет учить роботов чему-то творческому и необычному.
Есть немало видео, где роботы танцуют, точнее выполняют заранее запрограммированную последовательность движений, синхронизированных с музыкой. Чтобы машины импровизировали и взаимодействовали друг с другом, Кэти и несколько других инженеров разработали алгоритм ИИ, обученный на предпочтениях хореографа (конечно, самой Кэти).
Часто по вечерам, а иногда и в выходные, когда роботы не были заняты повседневными делами, Кэти и ее импровизированная команда собирали их в большом атриуме в центре офиса X. Машины начинали двигаться вместе, иногда сбивчиво, но всегда по интересным схемам.
Фото в тексте: Ганс Петер Брондмо
Том Энгберсен — робототехник из Нидерландов, который в свободное время рисовал копии классических шедевров. Вместе с Кэти он начал сайд-проект по изучению того, могут ли танцующие роботы реагировать на музыку или даже играть на инструменте. Однажды у него возникла новая идея: что, если роботы сами станут инструментами? Так началось исследование, в ходе которого каждый сустав роботов воспроизводил звук при движении.
Основание издавало звук баса, а захват — колокольчика. Когда команда запускала музыкальный режим, роботы создавали уникальные оркестровые партитуры при каждом движении.
Это только начало
В конце 2022 года продолжались разговоры о том, какой подход лучше — гибридный или сквозное обучение. Питер с командой и сотрудниками из Google Brain работали над применением обучения с подкреплением, имитационного обучения и трансформеры (архитектура, лежащая в основе LLM) к нескольким задачам для роботов. Им удалось показать: машины способны обучаться так, чтобы стать общими, надежными и устойчивыми.
Читайте по теме:
Google DeepMind научила робота играть в настольный теннис на уровне человека
Роботы осваивают новые «профессии» — от массажиста до помощника по дому
Тем временем команда приложений под руководством Бенджи работала над тем, чтобы использовать модели ИИ с традиционным программированием для прототипирования и создания сервисных роботов, которые можно развернуть среди людей в реальных условиях.
Тем временем Project Starling, как назвали проект Кэти, изменил отношение Брондмо к этим машинам. Он заметил, что люди наблюдали за роботами с удивлением, радостью и любопытством, и пришел к выводу, что движения и звуки роботов могут вызывать сильные человеческие эмоции. Это важный фактор, от которого зависит, как мы примем их в нашу повседневную жизнь (и произойдет ли это).
Другими словами, умные роботы вот-вот должны были стать полезными. ИИ давал машинам возможность понимать услышанное (устный и письменный язык) и переводить это в действия, а также распознавать увиденное (изображения с камеры) и превращать это в сцены и объекты, с которыми можно взаимодействовать.
И, как показала команда Питера, роботы научились поднимать предметы. Спустя более семи лет мы развернули парки роботов в нескольких зданиях Google. Один тип роботов выполнял различные задачи: автономно протирал столы в кафе, осматривал конференц-залы, сортировал мусор и многое другое.
Фото в тексте: Ганс Петер Брондмо
Именно тогда, в январе 2023 года, через два месяца после выхода ChatGPT, Google закрыла Everyday Robots из-за высоких затрат. Роботы и небольшое число людей перешли в Google DeepMind для проведения исследований. Несмотря на высокие расходы и долгие сроки, все члены команды были шокированы.
Роботы — необходимость для некоторых стран
В 1970 году на каждого человека старше 64 лет в мире приходилось 10 человек трудоспособного возраста. К 2050 году их, вероятно, будет меньше четырех. Проблема особенно актуальна в таких странах, как Япония, Китай и Южная Корея, которые активно инвестируют в робототехнику.
Создать физическое тело для ИИ — это как вопрос национальной безопасности, так и огромная экономическая возможность. Если такая технологическая компания, как Google, решает, что не может инвестировать в такие проекты, то кто это сделает? Возьмется ли за это Кремниевая долина или другие экосистемы стартапов, и если да, то будет ли у них доступ к долгосрочному капиталу? Брондмо в этом сомневается.
Инженер считает, что Everyday Robots получил статус moonshot (так называют крайне амбициозные и инновационные проекты), поскольку создание сложнейших систем такого масштаба вышло далеко за рамки того, на что обычно хватало терпения стартапам, финансируемым венчурным капиталом. По его мнению, хотя США опережает других в области ИИ, создание роботов требует навыков и инфраструктуры, в которых уже лидируют другие страны, в первую очередь Китай.
Фото на обложке: Ганс Петер Брондмо
Нашли опечатку? Выделите текст и нажмите Ctrl + Enter
Материалы по теме
- Пройти курс «Наличка: как использовать, чтобы не нарушить 115-ФЗ»
- 1 В России запустят маркетплейс запчастей для роботов и беспилотников
- 2 В Иннополисе завершился международный форум Digital Innopolis Days x AI IN 2024: итоги
- 3 «Вкусно — и точка» начала тестировать в ресторанах новых роботов
- 4 На федеральный проект промышленной робототехники выделят 350 млрд рублей
ВОЗМОЖНОСТИ
14 ноября 2024
14 ноября 2024
14 ноября 2024