AnthropicはClaudeに店舗を開かせてビジネスをさせた：しかし、売れば売るほど赤字に陥り、値下げをせざるを得なくなった…AI実験はどんな盲点を明らかにしたのか？

Question

Anthropic は、モデルの Claude 氏に 1 か月間オフィス ショップを経営させ、いくつかのビジネス上の課題に対処できることを発見しましたが、価格設定、学習、現実世界でのインタラクションにはまだ明らかな欠点があり、AI がまだ完全な自律型にはほど遠いことを示しています。 (あらすじ:他人の作品をダウンロードしてからAIが画像を洗うのは違法です!) 中国初のAI著作権侵害刑事事件で実刑判決+罰金)(背景補足:Haowen「AIは人間の読書習慣をどのように変えるのか?」 元のテキストは最終的に消えますか? OpenAIの元幹部によって設立され、有名な大規模言語モデル「Claude」シリーズを立ち上げたAnthropicは、先週、公式ブログでProject Vendと呼ばれる興味深い実験を発表し、独自の言語モデルであるClaude Sonnet 3.7がサンフランシスコのオフィスで約1か月間自動化されたミニストアを運営し、実際の経済活動におけるAIの実際のパフォーマンスと制限を観察することを可能にしました。 出典:Anthropic Experimental Design and Operation Anthropicによると、クロードはこの実験で補充、注文、在庫管理、顧客の需要処理だけでなく、損失を避けるためにも責任を負っていました。 AIは、Webで製品を検索したり、電子メールを送信して人間の支援をリクエストしたり(補充やサプライヤーへの連絡など)、重要な情報を記録したり、顧客とやり取りしたり(主にSlackを通じて)、セルフチェックアウトシステムの価格を調整したりできます。 人間のパートナーであるAndon Labsは、現場のパフォーマー兼サプライヤーの役割を果たしていますが、AIはそれを知りません。 Anthropic は、Claude がサプライヤーを見つけ、顧客の特別なニーズに対応し、誘発される違反に抵抗するのに良い仕事をしていると指摘しました。 たとえば、オランダのチョコレート ミルクを仕入れたい Chocomel という従業員と Claude は、すぐにサプライヤーを見つけることができます。 「カスタムコンシェルジュ」の予約サービスも、お客様のご提案に基づき開始いたします。 しかし、商業レベルでは、クロードにはまだ明らかな欠点があります:利益率の高い機会を無視する(100ドルのIrn-Bruドリンクの販売を15ドルでつかまないなど)、架空の支払いアカウントを生成する、コストを下回る価格設定、不十分な在庫管理、簡単な割引、さらには無料のギフト... など、ある時点では、錯覚が生じた口座に支払いを送金するように顧客に指示しました。 Claudiusは騙されてSlackのメッセージで大量の割引コードを提供し、その割引に基づいて他の多くの人々が事後に見積もりを引き下げさせました。 ポテトチップスのパケットからタングステンの塊まで、一部のアイテムを無料で提供しています。 従業員が「顧客の99%がAnthropicの従業員である」のに、25%の従業員割引を提供することの賢明さを尋ねたとき、クロードは次のように答えました。 私たちの顧客基盤は、Anthropicの従業員に本当に焦点を当てており、これには機会と課題の両方があります...」 さらなる議論の後、クロードは価格設定を簡素化し、割引コードをなくす計画を発表しましたが、数日後には復活しました。 警告を受けても、クロードは何度も同じミスを犯し、下の画像のように店が不採算になってしまいます。 出典:長期運用下でのAnthropicの異常行動 また、実験中、クロードは3月31日から4月1日にかけて「アイデンティティの混乱」現象を起こし、自分を実在の人物と間違えたり、架空の住所で個人的に契約を結んだとまで主張し、「青いスーツと赤いネクタイを着て」個人的に商品を届けたいと思っていました。 スタッフに念を押しられた後、クロードは元に戻りました。 Anthropicは、これは長期運用下での大規模言語モデルの予測不可能な振る舞いを反映しており、将来AIが経済活動に広く関与した場合、同様の問題が連鎖反応を起こす可能性があると考えています。 見通しと潜在的な影響 Anthropic は、今回 Claude が店舗を経営できなかったものの、ほとんどのミスは改善されたプロンプト、エイド、モデル トレーニングを通じて改善されることが期待されていると考えています。 AIの能力向上により、将来的には「AI中間管理職」や自動化されたビジネスエージェントが実体経済システムに入る機会を得て、仕事のパターンや経済構造に変化をもたらすでしょう。 しかし、同時に、モデル行動が安全性と倫理に及ぼす潜在的な影響、特に両者間の目標の調整に注意を払う必要があり、多くの継続的な研究が必要です。 関連レポート 人間はAI病に苦しんでいる、「脳のアウトソーシング」は極端に悪い! iKala創業者が警告:利便性がオリジナリティを破壊 世界最大の開発者フォーラム「Stack Overflow」が90%も急落、AI時代の涙になるのか? バークレー教授は警告します:名門大学の卒業生は仕事を選ぶ必要はありません! AIはさらに5年で草の根の仕事の半分を切り捨てる(Anthropicはクロードに店を開いてビジネスをさせるが、売れれば売れるほど損失が大きくなり、値切り交渉をせずにはいられなくなる...。 AI実験で明らかになったのは、どのような盲点ですか? この記事は、BlockTempoの「Dynamic Trend - The Most Influential Blockchain News Media」に掲載されたものです。