Агент, который видит всё, уже на пороге.
OpenAI готовится представить «Operator» — нового агента, способного выполнять задачи в веб-браузере от имени пользователя. Это очередной шаг в развитии технологий, которые компании, включая Google и Anthropic, считают ключевыми для создания искусственного интеллекта, способного заменить людей в рутинных операциях,сообщает securitylab.ru.
Согласно информации издания The Information , «Operator» будет предлагать пользователям подсказки в различных категориях, таких как путешествия, рестораны или мероприятия. Например, с помощью агента можно найти удобный рейс из Нью-Йорка на Мауи с учетом предпочтительного времени прибытия. Однако завершение транзакций останется на пользователе.
«Operator» демонстрирует потенциальные преимущества таких технологий. Он может помогать пользователям, не уверенно чувствующим себя в интернете, например, пожилым людям. Агент способен, например, открыть Gmail и подготовить окно для написания письма. Также его можно использовать в бизнесе, например, для тестирования новых сайтов и сервисов.
Но такие технологии несут риски. Уже существуют стартапы, использующие аналогичные боты для автоматизации спам-рассылок на Reddit. Подобные инструменты обходят ограничения API, что может увеличить объем нежелательного контента в сети. Разработчики должны будут создать механизмы защиты от злоупотреблений.
«Operator» функционирует, анализируя скриншоты браузера пользователя и отправляя команды для выполнения необходимых действий. Это возможно благодаря мультимодальным технологиям, которые обрабатывают текст и изображения, определяя нужные шаги.
Тем временем рынок искусственного интеллекта сталкивается с вызовами. Многие пользователи разочарованы ранними версиями подобных агентов. Например, тестеры бота от Anthropic отмечали его неспособность справляться с задачами: он застревал в циклах или отвлекался на просмотр картинок природы. Кроме того, эти технологии остаются медленными и дорогими в использовании.
Сохранение контроля человека над процессом критически важно, учитывая уровень доступа ботов к данным. Подобно развитию автономных автомобилей, совершенствование компьютерных агентов требует решения множества сложных задач.
OpenAI связывает достижение так называемого искусственного общего интеллекта (AGI) с созданием ИИ, способного приносить прибыль в $100 миллиардов. Однако до этой цели далеко: компания прогнозирует доход в $12 миллиардов к 2025 году, но ожидает убытки. Принятие подобных технологий бизнесом также идет медленнее, чем ожидалось. Microsoft и Google вынуждены включать ИИ-инструменты в стандартные пакеты, увеличивая их стоимость на пару долларов вместо дополнительной подписки.
Источник securitylab.ru