Le premier agent IA d'OpenAI, "Operator", est arrivé ! Il peut vous aider à faire du shopping, réserver des billets, commander des plats à emporter... et résoudre des tâches ennuyeuses sur Internet.

OpenAI lance officiellement le premier agent IA "Operator" capable de contrôler indépendamment le navigateur pour exécuter diverses tâches, telles que la réservation de voyages, la commande de plats à emporter, le remplissage de formulaires, etc., et prend en charge le traitement multitâche et la personnalisation. L'Operator est actuellement réservé aux utilisateurs professionnels aux États-Unis. (Contexte préalable : ChatGPT o3-mini bientôt disponible ! OpenAI renforce sa gamme de produits : lancement au T1 des outils AI Agents) (Contexte supplémentaire : OpenAI, SoftBank et Oracle lancent le plus grand projet d'infrastructure IA de l'histoire, le "Projet Stargate" : un investissement de 500 milliards de dollars pour établir des centres de données aux États-Unis) Les agents IA sont un domaine très important cette année à la fois pour l'industrie de l'IA et du chiffrement. Depuis la sortie de "Computer Use" d'Anthropic à la fin de l'année dernière, un système IA capable d'opérer une interface informatique comme un être humain, le développement des agents IA a pris une ampleur encore plus grande. Aujourd'hui, OpenAI, un leader de l'intelligence artificielle générative, lance officiellement son premier agent IA, faisant ainsi l'objet de nombreuses discussions au sein de la communauté de l'IA. Fonctionnalités et champ d'application de l'Operator Selon les informations disponibles, l'Operator est un agent IA capable de contrôler indépendamment un navigateur pour exécuter diverses tâches pour l'utilisateur. L'utilisateur n'a qu'à décrire la tâche à accomplir, et l'Operator se charge du reste, que ce soit pour réserver un voyage ou un restaurant sur Booking.com, commander des courses ou des plats à emporter sur UBER, remplir des formulaires, rassembler des listes de courses, créer des mèmes... Il peut gérer plusieurs tâches simultanément (comme ouvrir plusieurs onglets dans un navigateur). De plus, il peut mémoriser les préférences et les réglages de l'utilisateur pour offrir un service plus personnalisé ; l'utilisateur peut également intervenir à tout moment pour ajuster ou annuler une tâche. Outre sa commodité, l'Operator accorde également une grande importance à la sécurité et à la confidentialité des utilisateurs. Selon le fabricant, l'utilisateur peut supprimer tout l'historique de navigation et se déconnecter de tous les sites en un clic. De plus, OpenAI propose des options de confidentialité qui permettent à l'utilisateur de désactiver la fonction "Amélioration du modèle" pour éviter que ses données ne soient utilisées à des fins d'entraînement du modèle. L'Operator est actuellement en phase de prévisualisation et n'est disponible que pour les utilisateurs professionnels aux États-Unis (souscription mensuelle de 200 dollars), accessible via le site Operator.ChatGPT.com. Il sera étendu à l'avenir aux utilisateurs Plus, Teams et Entreprise. J'ai eu un accès anticipé à ChatGPT Operator. Il s'agit du nouvel agent IA d'OpenAI qui agit de manière autonome sur le web en votre nom. Les 9 cas d'utilisation les plus impressionnants que j'ai testés (vidéos accélérées) : 1. Commander des ingrédients pour le dîner en fonction d'une photo et d'une recette pic.twitter.com/tdbApPELD4 — Rowan Cheung (@rowancheung) 23 janvier 2025 Principe de fonctionnement L'Operator fonctionne sur la base d'un nouveau modèle appelé "Computer-Using Agent (CUA)". Le CUA associe les capacités de traitement visuel du GPT-4o à l'inférence avancée apportée par l'apprentissage par renforcement, spécialement formé pour interagir avec l'interface utilisateur graphique (GUI), telle que les boutons, les menus et les champs de texte à l'écran. À l'aide de captures d'écran, l'Operator peut "voir" le contenu de l'interface et "interagir" en utilisant la souris et le clavier pour effectuer des opérations sur les pages web sans nécessiter d'intégration API. En cas de problème ou d'erreur, l'Operator utilise ses capacités d'inférence pour se corriger automatiquement ; s'il ne parvient pas à résoudre le problème, il restitue le contrôle à l'utilisateur pour garantir un fonctionnement fluide et une collaboration avec l'utilisateur pour accomplir la tâche. OpenAI indique qu'il a déjà établi des partenariats avec plusieurs entreprises, dont DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber, etc., pour s'assurer que l'Operator respecte les normes tout en répondant aux besoins réels. Limites de l'Operator Cependant, selon l'entrepreneur Greg Isenberg, l'Operator présente également certaines limites. Par exemple, il ne peut pas gérer les tâches liées aux paiements ou à la connexion, il peut rester bloqué dans des interfaces complexes, il est incapable de résoudre les CAPTCHAs (tests de Turing complets pour la distinction des ordinateurs et des humains), et son utilisation est limitée chaque jour. De plus, le moment du lancement en Europe n'est pas encore déterminé, selon Sam Altman, PDG d'OpenAI, il faudra "un certain temps". Pour l'avenir, l'Operator offrira une API aux développeurs, continuera d'améliorer ses fonctionnalités et élargira sa base d'utilisateurs, et intégrera directement cette fonctionnalité dans ChatGPT. Articles connexes Le modèle le plus puissant d'OpenAI, o3, "triche" en obtenant des réponses à des tests privilégiés, fausse-t-il ses capacités mathématiques ? Vous voulez contrôler ChatGPT ? Musk écrit au procureur général pour exiger la vente forcée des actions d'OpenAI OpenAI lance le modèle o3 ! Les capacités d'inférence repoussent à nouveau les limites, ouvrant la voie à la prochaine génération d'IA 〈Le premier agent IA d'OpenAI, "Operator", est là ! Peut vous aider à faire des achats, réserver des billets, commander des plats à emporter... résoudre des tâches en ligne fastidieuses〉Cet article a été initialement publié dans BlockTempo, média d'information sur la Blockchain le plus influent de la Bloc.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)