Говорящие и танцующие роботы Optimus на недавней демонстрации Tesla вызвали огромный восторг. Но он сменился разочарованием, когда стало очевидно, что многое из происходящего на самом деле управляется дистанционно людьми. И это уже не первый случай, когда роботы оказываются слишком хорошими, чтобы быть правдой,сообщает techinsider.ru.
Фото: depositphotos.com
Возьмем, к примеру, Sophia — робота, созданного техасской компанией Hanson Robotics в 2016 году. Компания представила ее как по сути разумное существо, что заставило многих специалистов по технологиям назвать ее выходящей за рамки наших возможностей на тот момент.
Аналогичным образом мы видели тщательно срежиссированные видеоролики с заранее запрограммированными действиями, например, гимнастику Atlas от Boston Dynamics и «пробуждение» робота Ameca, и совсем недавно Optimus от Tesla, работающий на заводе. Конечно, все это впечатляет, но выпустите Optimus или Atlas на свободу в случайном доме, и вы увидите нечто совсем другое.
Робот-гуманоид, способный работать в наших домах, должен уметь выполнять множество различных задач, использовать наши инструменты, ориентироваться в окружающей среде и общаться с нами как человек. Если вы думали, что это произойдет через год или два, то вас ждет разочарование.
Создание роботов, способных выполнять сложные задачи в наших домах и на улицах, все еще остается огромной проблемой. Создать их даже для того, чтобы они хорошо выполняли одну конкретную задачу, например, открывали дверь, феноменально сложно.
Существует огромное количество дверных ручек разной формы, веса и материалов, не говоря уже о том, что приходится сталкиваться с непредвиденными обстоятельствами, такими как запертая дверь или предметы, преграждающие путь. Разработчики уже создали робота, открывающего дверь, но робота, способного решать сотни повседневных задач так и не сделали.
За занавесом
Техника дистанционного управления «Волшебником из страны Оз», продемонстрированная Tesla, является широко используемым методом управления в этой области и дает исследователям эталон, на котором они могут проверить свои реальные достижения. Этот метод, известный как телеметрическое управление, существует уже давно и становится все более совершенным.
Один из авторов этой статьи, Карл Стратерн, в начале этого года был на конференции в Японии, где основной докладчик из одной из ведущих робототехнических лабораторий демонстрировал передовую телеметрическую систему. Она позволяла одному человеку одновременно управлять множеством человекоподобных роботов в полуавтономном режиме, используя заранее прописанные движения, подсказки и речь.
Очевидно, что это очень полезная технология. Телеметрические системы используются для управления роботами, работающими в опасных условиях, в здравоохранении для инвалидов и даже в космосе. Но человек все равно остается за штурвалом, потому что даже самые совершенные человекоподобные роботы, такие как Atlas, еще недостаточно надежны, чтобы работать полностью самостоятельно в реальном мире.
Еще одна серьезная проблема — это то, что мы можем назвать социальным ИИ. Ведущие программы генеративного ИИ, такие как Gemini от DeepMind и GPT-4 Vision от OpenAI, в будущем могут стать основой для создания творческих автономных систем ИИ для человекоподобных роботов. Но не стоит заблуждаться, полагая, что такие модели означают, что робот теперь способен хорошо функционировать в реальном мире.
Интерпретация информации и решение проблем, стоящих перед человеком, требуют гораздо большего, чем просто распознавание слов, классификация объектов и генерация речи. Это требует более глубокого контекстного понимания людей, объектов и окружающей среды — другими словами, здравого смысла.
Чтобы изучить, что возможно в настоящее время, робототехники недавно завершили исследовательский проект под названием Common Sense Enhanced Language and Vision (CiViL). Они наделили робота по имени Euclid представлением о здравом смысле как части генеративной системы зрения и языка ИИ, чтобы помочь людям в приготовлении блюд. Для этого пришлось создать базы данных, используя примеры решения реальных проблем, которые приводили студенты.
Euclid мог объяснять сложные шаги при приготовлении еды, давать рекомендации, когда что-то шло не так, и даже указывать людям на места на кухне, где обычно можно найти посуду и инструменты. Но все равно оставались вопросы, например, что делать, если во время готовки у кого-то началась сильная аллергическая реакция. Проблема в том, что практически невозможно предусмотреть все возможные сценарии, но именно это и подразумевает настоящий здравый смысл.
Этот фундаментальный аспект ИИ с годами несколько отошел на второй план в создании человекоподобных роботах. Генерируемая речь, реалистичная мимика, телеметрическое управление, даже способность играть в такие игры, как «камень-ножницы-бумага», — все это впечатляет. Но новизна вскоре исчезает, если роботы на самом деле не способны самостоятельно делать что-либо полезное.
Это не значит, что в создании автономных гуманоидных роботов не наблюдается значительного прогресса. Например, ведется впечатляющая работа над нервными системами роботов, чтобы дать им больше органов чувств для обучения. Просто обычно им не уделяется столько внимания в прессе, сколько большим презентациям вроде Optimus.
Дефицит данных
Еще одна ключевая проблема — нехватка реальных данных для обучения систем ИИ, поскольку онлайн-данные не всегда точно отражают реальные условия, необходимые для обучения наших роботов. Нам еще предстоит найти эффективный способ сбора таких реальных данных в достаточно больших объемах, чтобы получить хорошие результаты. Однако вскоре ситуация может измениться, если мы сможем получать доступ к ним с помощью таких технологий, как Alexa и Ray-Bans.
Тем не менее, реальность такова, что до создания мультимодальных человекоподобных роботов с продвинутым социальным ИИ, способных помогать по дому, еще, возможно, несколько десятилетий. Возможно, в это время нам предложат роботов, управляемых дистанционно из командного центра. Но захотим ли мы их?
Пока же нам важнее сосредоточить усилия на создании роботов, способных поддерживать людей, которым срочно нужна помощь. В качестве примера можно привести здравоохранение, где существуют длинные очереди и нехватка персонала в больницах, а также образование, чтобы обеспечить возможность удаленного участия в занятиях для перевозбужденных или тяжелобольных детей.
Нам также необходимы прозрачность, законодательство и общедоступные тесты, чтобы каждый мог отличить факт от вымысла и укрепить доверие общества к роботам, когда они появятся.
Автор Владимир Губайловский
Источник techinsider.ru