Chegou o primeiro agente de IA da OpenAI, o 'Operador'! Pode ajudá-lo a fazer compras, reservar bilhetes, pedir entrega de comida, etc., para resolver tarefas online complexas.

OpenAI lança oficialmente seu primeiro agente de IA "Operator", que pode controlar automaticamente o navegador para executar várias tarefas, como reservar viagens, fazer pedidos de entrega de comida, preencher formulários, etc., e suporta processamento de várias tarefas e configurações personalizadas. Operator está atualmente disponível apenas para usuários profissionais nos Estados Unidos. (Resumo anterior: ChatGPT o3-mini será lançado em breve! OpenAI Products Manager: AI Agents Tool será lançado no Q1) (Contexto adicional: OpenAI, SoftBank e Oracle lançam o maior projeto de infraestrutura de IA da história, o "Stargate Project": investimento de 500 bilhões de dólares para estabelecer centros de dados nos EUA) O agente de IA é uma pista muito valorizada na indústria de IA e criptografia este ano. Depois que o sistema de IA "Computer Use" da Anthropic, capaz de operar a interface do computador como um ser humano, foi lançado em outubro do ano passado, o desenvolvimento do agente de IA se expandiu ainda mais. Hoje, a OpenAI, líder em inteligência artificial generativa, lançou oficialmente seu primeiro agente de IA, o "Operator", tornando-se um tópico importante na comunidade de IA. Funcionalidades e alcance do Operator É compreendido que o Operator é um agente de IA que pode controlar o navegador de forma autônoma para executar várias tarefas para o usuário. O usuário só precisa descrever a tarefa que deseja concluir, e o Operator pode lidar com o restante do trabalho, como reservar viagens e restaurantes no Booking.com, fazer pedidos de supermercado e entrega de comida no Uber Eats, preencher formulários, coletar listas de compras, criar memes... ele pode lidar com várias tarefas ao mesmo tempo (como abrir várias guias em um navegador). Além disso, ele pode lembrar as preferências e configurações do usuário, fornecendo serviços mais personalizados, e o usuário pode intervir a qualquer momento para ajustar ou interromper a tarefa. Além da conveniência das funcionalidades, o Operator também valoriza a privacidade e segurança do usuário. O site afirma que o usuário pode excluir todo o histórico de navegação e sair de todos os sites com um clique. Ao mesmo tempo, a OpenAI fornece opções de configuração de privacidade, para que o usuário possa escolher desativar a função "melhorar modelo" para evitar que seus dados sejam usados para treinamento do modelo. O Operator é atualmente uma versão de visualização do projeto de pesquisa e só está disponível para usuários profissionais nos Estados Unidos (taxa mensal de $200), e os usuários podem acessá-lo através do site Operator.ChatGPT.com. Será expandido para usuários Plus, Teams e Enterprise no futuro. Tive acesso antecipado ao ChatGPT Operator. É o novo agente de IA da OpenAI que toma autonomamente ações na web em seu nome. As 9 tarefas mais impressionantes que experimentei em vídeos acelerados: 1. Pedir ingredientes para o jantar com base em uma foto e em uma receita pic.twitter.com/tdbApPELD4 - Rowan Cheung @rowancheung em 23 de janeiro de 2025 Princípio de operação O Operator é baseado em um novo modelo chamado "Computer-Using Agent (CUA)", que combina a capacidade de processamento visual do GPT-4o com a lógica avançada trazida pelo aprendizado por reforço e é especialmente treinado para interagir com a interface gráfica do usuário (GUI), como botões, menus e campos de texto na tela. Com capturas de tela, o Operator pode "ver" o conteúdo da interface e "interagir" por meio de operações de mouse e teclado para executar operações na web sem a necessidade de integração com a API. Quando encontram desafios ou erros, o Operator usa sua capacidade de raciocínio para correção automática; se não conseguir resolver o problema, ele devolverá o controle ao usuário para garantir que as operações sejam suaves e colaborativas. A OpenAI indicou que já estabeleceu parcerias com alguns parceiros, incluindo DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, etc., para garantir que o Operator atenda aos requisitos práticos enquanto segue as normas estabelecidas. Limitações do Operator No entanto, o empreendedor Greg Isenberg compartilhou que o Operator também tem algumas limitações. Por exemplo, ele não pode lidar com tarefas relacionadas a pagamentos ou login, pode ficar preso em interfaces complexas, não pode lidar com CAPTCHAs (verificações de segurança) e tem limitações no número de usos diários. Além disso, o tempo de lançamento na Europa ainda não foi definido e, de acordo com o CEO da OpenAI, Sam Altman, "levará algum tempo". No futuro, o Operator abrirá sua API para fornecer suporte aos desenvolvedores, ao mesmo tempo em que aprimora constantemente suas funcionalidades e expande sua cobertura de usuários, e no futuro, integrará diretamente essa funcionalidade no ChatGPT.

Ver original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)