¡Llega el primer agente de inteligencia artificial de OpenAI, 'Operator'! Puede ayudarte a comprar, reservar boletos, pedir comida para llevar... y resolver tareas en línea tediosas.

OpenAI lanzó oficialmente el primer agente de IA "Operador", que puede controlar de forma autónoma el navegador para realizar diversas tareas, como reservar viajes, pedir comida para llevar, rellenar formularios, etc., y admitir la multitarea y la personalización. Actualmente, Operator solo está disponible para usuarios de US Pro. (Sinopsis: ¡ChatGPT o3-mini próximamente!) Producto de OpenAI long plus: Q1 lanza herramientas de AI Agents) (Suplemento de antecedentes: OpenAI, SoftBank, Oracle lanzaron el plan de infraestructura de IA más grande de la historia "Proyecto Stargate": Invertir $ 500 mil millones para establecer un centro de datos en los Estados Unidos) Agentes de IA (agentes) Este año, la industria de la IA y el campo de la encriptación son pistas muy importantes. Desde el advenimiento del "Uso de la computadora" de Anthropic: un sistema de IA que puede operar interfaces de computadora como un humano a fines de octubre pasado, el desarrollo de agentes de IA se ha expandido a una imaginación más amplia. Hoy, OpenAI, líder en inteligencia artificial generativa (IA), también ha lanzado oficialmente su primer agente de IA "Operator", que se ha convertido en un tema importante en la comunidad de IA. Función del operador y ámbito de uso Se entiende que el operador es un agente de IA que puede controlar de forma autónoma el navegador y realizar diversas tareas para los usuarios. EL USUARIO SIMPLEMENTE DESCRIBE LA TAREA QUE QUIERE REALIZAR Y EL OPERADOR SE ENCARGA DEL RESTO, COMO RESERVAR VIAJES Y RESTAURANTES EN Booking.com, PEDIR COMESTIBLES Y COMIDA PARA LLEVAR EN UBER, RELLENAR FORMULARIOS, RECOPILAR LISTAS DE LA COMPRA PARA TI, CREAR MEMES... Es posible realizar varias tareas a la vez (como si abriéramos varias paginaciones en el navegador). Además, puede recordar las preferencias y configuraciones del usuario para brindar un servicio más personalizado; El usuario también puede intervenir en cualquier momento para ajustar la operación o finalizar la tarea. Además de la comodidad de las funciones, Operator también valora la privacidad de los usuarios. Oficialmente, los usuarios pueden eliminar todo el historial de navegación y cerrar sesión en todos los sitios web con un solo clic. Al mismo tiempo, OpenAI ofrece opciones de configuración de privacidad, y los usuarios pueden optar por desactivar la función "Mejorar modelo" para evitar que sus datos se utilicen para el entrenamiento del modelo. Operator se encuentra actualmente en fase de investigación y solo está disponible para usuarios Pro en los EE. UU. (la suscripción cuesta $ 200 por mes) y se puede acceder a través del Operator.ChatGPT.com. Expansión futura a usuarios de Plus, Teams y Enterprise. Obtuve acceso anticipado a ChatGPT Operator. Es el nuevo agente de IA de OpenAI que actúa de forma autónoma a través de la web en su nombre. Los 9 casos de uso más impresionantes que he probado (videos acelerado up): 1. Pedir ingredientes para la cena basados en una imagen y una receta pic.twitter.com/tdbApPELD4 — Rowan Cheung (@rowancheung) 23 de enero de 2025 El operador opera en base a un nuevo modelo llamado Computer-Using Agent (CUA). CUA combina la potencia de procesamiento visual de GPT-4o con la inferencia avanzada habilitada por el aprendizaje por refuerzo, específicamente entrenado para interactuar con (GUI) de interfaz gráfica de usuario, como botones en pantalla, menús y campos de texto. Al tomar capturas de pantalla, los operadores pueden "ver" el contenido de la interfaz e "interactuar" mediante operaciones con el mouse y el teclado, lo que permite operaciones de páginas web sin integración de API. Cuando se le desafía o comete errores, el Operador utiliza sus habilidades de razonamiento para corregirse a sí mismo; Si el problema no se puede resolver, el control se devuelve al usuario, lo que garantiza un funcionamiento fluido y la colaboración con el usuario para completar la tarea. OpenAI dice que se ha asociado con varios socios, incluidos DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber y otros, para garantizar que los operadores satisfagan las necesidades reales mientras se adhieren a las especificaciones establecidas. Sin embargo, según el empresario Greg Isenberg, los operadores también tienen algunas limitaciones. Por ejemplo, no puede procesar pagos o tareas relacionadas con el inicio de sesión, puede quedarse atascado en interfaces complejas, no puede hacer nada con respecto a los CAPTCHA (códigos de verificación) y tiene un número limitado de usos por día. Además, aún no se ha determinado la hora de lanzamiento para Europa y, según el CEO de OpenAI, Sam Altman, "llevará un tiempo". En el futuro, Operator abrirá las API para apoyar a los desarrolladores, al tiempo que continuará mejorando la funcionalidad y ampliando el alcance de los usuarios, y en el futuro, esta función se integrará directamente en ChatGPT. Informes relacionados El modelo más fuerte de OpenAI o3 "expuso trampas" sospechoso de usar privilegios para obtener respuestas de pruebas por adelantado, ¿fraude de habilidad matemática? ¿Quieres controlar ChatGPT? Musk envió una carta al inspector general exigiendo una subasta obligatoria de acciones de OpenAI ¡OpenAI lanza el modelo o3! La capacidad de razonamiento vuelve a subir de nivel, allanando el camino para la próxima generación de IA 〈¡El primer agente de IA "Operador" de OpenAI está aquí! Puede ayudarte a comprar, reservar entradas, pedir entrega... Resolviendo tareas de red engorrosas" Este artículo se publicó por primera vez en "Dynamic Trends - The Most Influential Bloquear Chain News Media" de BlockTempo.

Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentar
  • Compartir
Comentar
0/400
Sin comentarios
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)