Первый AI-агент от OpenAI, Operator, пришел! Он может помочь вам с покупками, заказами билетов, вызовом доставки... и решением различных интернет-задач.

OpenAI официально запускает первого агента ИИ "Operator", который самостоятельно управляет браузером для выполнения различных задач, включая бронирование путешествий, заказ еды на вынос, заполнение форм и т. д., и поддерживает многозадачную обработку и персонализацию. В настоящее время Operator доступен только для пользователей в США Professional Edition. (Предыдущий контекст: скоро выход ChatGPT o3-mini! OpenAI усиливает продукт: в первом квартале запуск инструментов AI Agents.) (Дополнительная информация: OpenAI, SoftBank, Oracle запускают самый большой в истории проект построения ИИ "Stargate Project": инвестиции в размере 500 миллиардов долларов США в центры обработки данных в США.) Агент ИИ (агент) - это гонка, на которую в этом году обращают большое внимание как в индустрии искусственного интеллекта, так и в области шифрования. С момента появления в октябре прошлого года "Computer Use" от Anthropic: системы ИИ, способной работать с компьютерным интерфейсом, как человек, развитие агента ИИ начало представлять себе более широкие перспективы. А сегодня ведущий в области генеративного искусственного интеллекта (AI) OpenAI также официально запускает своего первого агента ИИ "Operator", становясь темой для обсуждения в сообществе AI. Функции и область применения Operator По информации, Operator - это агент ИИ, способный самостоятельно управлять браузером, выполняя различные задачи для пользователя. Пользователю нужно только описать задачу, которую он хочет выполнить, и Operator может обработать оставшуюся работу, такую как бронирование на Booking.com и заказ еды и ресторанов, заказ продуктов и еды в UBER, заполнение форм, сбор списков покупок, создание мемов... может обрабатывать несколько задач одновременно (как если бы мы открывали несколько вкладок в браузере). Кроме того, он также может запоминать предпочтения и настройки пользователя, предоставляя более персонализированные услуги; пользователь также может в любое время вмешиваться, корректировать операции или завершать задачи. Кроме удобства функций, Operator также уделяет внимание безопасности конфиденциальности пользователей. Официально заявлено, что пользователи могут удалить все записи о посещении сайтов, а также выйти со всех сайтов одним нажатием. Кроме того, OpenAI предоставляет опцию настроек конфиденциальности, позволяющую пользователям отключить функцию "Улучшение модели", чтобы избежать использования их данных для обучения модели. В настоящее время Operator находится в режиме предварительного просмотра и доступен только для пользователей Professional Edition в США (ежемесячная подписка стоит 200 долларов США), пользователи могут получить доступ по адресу Operator.ChatGPT.com. В будущем он будет расширен на Plus, Teams и Enterprise пользователей. У меня есть ранний доступ к ChatGPT Operator. Это новый агент ИИ от OpenAI, который автономно действует в сети от вашего имени. 9 самых впечатляющих случаев использования, которые я попробовал (видео ускорено): 1. Заказ продуктов на ужин на основе фотографии и рецепта pic.twitter.com/tdbApPELD4 - Rowan Cheung (@rowancheung) 23 января 2025 Принцип работы Operator работает на основе новой модели под названием "Computer-Using Agent (CUA)". CUA объединяет возможности обработки изображений GPT-4o с продвинутым рассуждением, обеспеченным обучением с подкреплением, специально разработанным для взаимодействия с графическим пользовательским интерфейсом (GUI), таким как кнопки, меню и текстовые поля на экране. С помощью скриншотов Operator может "видеть" содержимое интерфейса и "взаимодействовать" с ним путем использования мыши и клавиатуры, что позволяет выполнять операции на веб-страницах без необходимости интеграции API. При возникновении проблем или ошибок Operator использует свои возможности рассуждения для самостоятельной коррекции; если проблема не удается решить, управление возвращается пользователю, чтобы гарантировать плавность операций и совместное выполнение задач с пользователем. OpenAI заявляет, что уже установлены партнерские отношения с некоторыми партнерами, включая DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber и другие, чтобы гарантировать соблюдение установленных стандартов и удовлетворение реальных потребностей Operator. Ограничения Operator Однако предприниматель Greg Isenberg поделился, что у Operator также есть некоторые ограничения. Например, он не может обрабатывать задачи, связанные с оплатой или входом в систему, может застрять на сложных интерфейсах, бессилен перед CAPTCHA (картинкой с текстом для проверки), и имеет ограниченное количество использований в день. Кроме того, время выпуска в Европе пока не определено, по словам генерального директора OpenAI Сэма Альтмана, это все еще "потребует некоторого времени". В будущем Operator откроет API, чтобы поддержать разработчиков, одновременно продолжая улучшать функционал и расширять охват пользователей, планируется прямое включение этой функции в ChatGPT.

Посмотреть Оригинал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Награда
  • комментарий
  • Поделиться
комментарий
0/400
Нет комментариев
  • Закрепить