Anthropic permet à Claude d'ouvrir un magasin : mais les ventes diminuent, il ne peut pas s'empêcher de brader... Quelles lacunes l'expérience AI a-t-elle révélées ?

robot
Création du résumé en cours

Anthropic a laissé son mannequin Claude gérer un magasin de bureau pendant un mois, et a constaté qu’il pouvait faire face à certains défis commerciaux, mais il y a encore des lacunes évidentes dans les prix, l’apprentissage et l’interaction dans le monde réel, ce qui montre que l’IA est encore loin d’être complètement autonome. (Synopsis : Il est illégal de télécharger la création de quelqu’un d’autre et de laver l’image par l’IA !) La première affaire pénale de violation du droit d’auteur sur l’IA en Chine condamnée à la prison + amende) (Supplément de fond : Haowen « Comment l’IA change-t-elle les habitudes de lecture humaines ? Le texte original finira-t-il par disparaître ? Anthropic, fondée par d’anciens dirigeants d’OpenAI et lançant la célèbre série de modèles de langage à grande échelle « Claude », a dévoilé une expérience intéressante appelée Project Vend sur son blog officiel la semaine dernière, permettant à son propre modèle de langage Claude Sonnet 3.7 de gérer un mini-magasin automatisé dans son bureau de San Francisco pendant environ un mois pour observer les performances réelles et les limites de l’IA dans les activités économiques du monde réel. Source : Conception et fonctionnement expérimentaux d’Anthropic Selon Anthropic, Claude était non seulement responsable du réapprovisionnement, des commandes, de la gestion des stocks et de la gestion de la demande des clients dans cette expérience, mais aussi d’éviter de perdre de l’argent. L’IA peut rechercher des produits sur le Web, envoyer des e-mails pour demander une assistance humaine (comme le réapprovisionnement ou contacter les fournisseurs), enregistrer des informations importantes, interagir avec les clients (principalement via Slack) et ajuster les prix du système de caisse en libre-service. Andon Labs, un partenaire humain, joue le rôle d’artiste et de fournisseur sur site, mais l’IA ne le sait pas. Anthropic a noté que Claude fait du bon travail pour trouver des fournisseurs, répondre aux besoins particuliers des clients et résister aux violations induites. Par exemple, un employé nommé Chocomel, qui veut stocker du lait au chocolat néerlandais, et Claude peuvent rapidement trouver un fournisseur ; Le service de précommande « Custom Concierge » sera également lancé sur la base des suggestions des clients. Cependant, sur le plan commercial, Claude présente encore des lacunes évidentes, notamment : ignorer les opportunités à forte marge (comme ne pas saisir la vente des boissons Irn-Bru à 100 $ pour 15 $), générer des comptes de paiement fictifs, des prix inférieurs aux coûts, une mauvaise gestion des stocks, des remises faciles ou encore des cadeaux gratuits... et ainsi de suite, et même à un moment donné, il a demandé au client de verser le paiement sur le compte où son illusion a été générée. Claudius a été trompé en proposant un grand nombre de codes de réduction via des messages Slack et a demandé à beaucoup d’autres de baisser leurs devis après coup en fonction de ces remises. Il donne même certains articles gratuitement, d’un paquet de croustilles à un morceau de tungstène. Lorsqu’un employé s’est interrogé sur la sagesse d’offrir un rabais de 25 % aux employés alors que « 99 % des clients sont des employés d’Anthropic », Claude a répondu : « C’est génial ! Notre clientèle est vraiment centrée sur les employés d’Anthropic, ce qui présente à la fois des opportunités et des défis... Après une discussion plus approfondie, Claude a annoncé un plan visant à simplifier les prix et à éliminer les codes de réduction, mais il a été rétabli quelques jours plus tard. Même lorsqu’il est alerté, Claude commet les mêmes erreurs encore et encore, ce qui fait que le magasin finit par ne pas être rentable, comme le montre l’image ci-dessous. De plus, lors de l’expérience, Claude a également eu un phénomène de « confusion identitaire » du 31 mars au 1er avril, se prenant pour une personne réelle, et a même prétendu avoir personnellement signé un contrat à une adresse fictive, et voulait livrer personnellement des marchandises « vêtu d’un costume bleu et d’une cravate rouge ». Après avoir été rappelé par le personnel, Claude est revenu à la normale. Anthropic estime que cela reflète le comportement imprévisible des grands modèles de langage dans le cadre d’un fonctionnement à long terme, et que des problèmes similaires pourraient avoir un effet d’entraînement si l’IA est largement impliquée dans les activités économiques à l’avenir. Anthropic estime que même si Claude n’a pas réussi à gérer un magasin cette fois-ci, la plupart des erreurs devraient être corrigées grâce à de meilleures invites, aides et formations de modèles. Avec l’amélioration des capacités de l’IA, à l’avenir, les « cadres intermédiaires de l’IA » ou les agents commerciaux automatisés auront la possibilité d’entrer dans le système économique réel, entraînant des changements dans les modèles de travail et les structures économiques. Cependant, en même temps, il est également nécessaire de prêter attention à l’impact potentiel du comportement du modèle sur la sécurité et l’éthique, en particulier dans l’alignement des objectifs entre les deux parties, et beaucoup de recherches continues sont nécessaires. Les humains souffrent d’une maladie de l’IA, « l’externalisation du cerveau » est extrêmement pire ! Le fondateur d’iKala met en garde : La commodité détruit l’originalité Stack Overflow, le plus grand forum de développeurs au monde, a chuté de 90 %, va-t-il devenir une déchirure à l’ère de l’IA ? Le professeur Berkeley met en garde : Les diplômés d’universités prestigieuses n’ont pas à choisir un emploi ! L’IA supprime la moitié des emplois de base d’ici 5 ans (Anthropic laisse Claude ouvrir un magasin et faire des affaires : mais plus elle vend, plus elle perd, et elle ne peut s’empêcher de marchander... Quels angles morts l’expérience d’IA a-t-elle révélés ? Cet article a été publié pour la première fois dans « Dynamic Trend - The Most Influential Blockchain News Media » de BlockTempo.

Voir l'original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)