GPT-5 — プロ、失敗、それとも平凡？

Question

![ChatGPT-5](https://img-cdn.gateio.im/social/moments-486e333267bde3873634eaa0e28e9dda)# GPT-5 - ブレークスルー、失敗、それとも平凡?8月7日、OpenAIは新しいフラッグシップAIモデルGPT-5を発表しました。この製品は、逐次的な推論と迅速な回答のモードを統合した最初の「ユニファイド」ニューラルネットワークとして位置付けられています。スタートアップのCEO、サム・アルトマンは、GPT-5を「世界最高のモデル」と「一般的な人工知能(AGI)の重要な一歩」と呼び、人間を最も経済的価値のある仕事で超えることができると述べました。彼女は本当にそんなに優れているのだろうか？ForkLogはAIの働きをテストし、ユーザーの意見を集め、GPT-5の詳細な分析を準備した。## **スムーズなローンチ**当初、GPT-5は質の悪い回答のために厳しい批判を受けました。ユーザーはこのモデルを怠惰だと呼び、ロボットのような口調で遅れて短いメッセージを出すと指摘しました。> 彼らは非推論モデルを「怠惰」と呼ぶべきだ。>   > なんか、gpt-5が怠けてる。>   > だから私たちはそれが推論できるが、そうしないことを選択していることを知っています。> > — signüll (@signulll) 2025年 8月 8日ハイパーボリックラボの共同創設者兼技術ディレクターであるユーチェン・ジンは、ニューラルネットワークを失敗作と呼びました。彼女は依然として幻覚を起こし、ハイフンを過剰に使用し、指示に従うことができません。GPT-5にブルーベリーという単語の中にあるbの数を尋ねたところ、チャットボットは考えずに「3」と答えました。再度の質問の後、彼は推論モードに入ったようで、しばらくしてから正しい答えを出しました。いくつかの開発者は、彼らの意見では、GPT-5がプログラミングの基本スキルにおいて後退を示していると指摘しました。彼女は基本的な概念において間違いを犯しており、これは知的エージェントと自律的コーディングの未来として宣伝されているモデルにとって不安の兆候です。> GPT-5のリアルプロジェクトコーディングに関するファーストインプレッション:>   > ひどい。>   > とても遅く、機能の改善を提案するように頼んだとき、改善すべき4つの点とそれに伴うコードを教えてくれました….>   > すべての4つの推奨事項は、機能が完全に壊れたか、まったく機能しませんでした。> > — Josh Sisley (@joshsisley) 2025年 8月 7日しかし、ユーザーが怒ったのはこれだけではなく、選択肢がないことでした。OpenAIは新しいニューラルネットワークを発表する際に、ChatGPTから古いモデルのサポートを削除しました。ネット上にはGPT-4oを戻す方法が掲載され始めました。その後、サム・アルトマンは、古いLLMをチャットボットから削除するという決定を誤りと呼び、プラスの有料サブスクリプションを持つユーザーのためにGPT-4oを復元しました。GPT-5の立ち上げに関する悪い回答について、スタートアップのCEOは壊れたルーター、つまりユーザーの代わりに「考える」モードまたは通常モードの必要性を決定する自動スイッチを説明しました。それは修理され、意思決定の境界の動作にいくつかの変更が加えられました。さらに、OpenAIのCEOは、質問に対する回答を見つけるプロセスにおいて、より多くの透明性を追加することを約束しました。この点についても批判がありました — ユーザーは「裏で何が起こっているのか」を理解していませんでした。今では、思考モードが適用されているのか、通常モードであるのかを見ることができます。もう一つの修正は、Plusユーザーと有料サブスクリプションを持たないユーザーのための制限の増加です。ユーザーは、ProおよびTeamがGPT-5 Proへの完全なアクセスを得ている一方で、他のユーザーは制限された「ミニバージョン」しか得られないと不満を述べています。## **ドライな回答**問題を抽象化して、すべての修正後にGPT-5を評価すると、回答はより正確で簡潔になりました。モデルは迅速に本質に移行し、関係のない詳細に気を取られることが少なくなります。これはプロフェッショナルに評価されています：直接的でビジネスライクな回答は時間を節約します。しかし、一部の一般ユーザーは不満を抱いています。回答は乾燥していて無機質に感じられ、コミュニケーションがあまり魅力的ではありません。新しいChatGPTは、「魅力と創造性に欠ける怒れるオフィス秘書」のようです。これをアルトマン氏は修正すると約束しました。チームはモデルの「個性」に引き続き取り組んでいます。> > 「[ChatGPT-5] は、何時間も友達のようにAIと愛らしい会話をしていた人にはあまり適しておらず、むしろ、迅速に明確な答えを得たい人により適している」とあるユーザーは指摘しました。> > > ChatGPTは今、相手に対してあまり気を使わなくなりました。もしGPT-4が時々過度の礼儀や称賛をしていたなら、新しいモデルはより直接的で正直かつ「ビジネスライク」な回答を提供しています。褒め言葉の減少は、人工知能の真実性において前進として評価できます。特に痛ましく感じたのは、ChatGPTを友人やAIコンパニオンとして使っていた人々のカテゴリーです。彼らにとって、古い神経ネットワークを復元する機能が最初からなかったことが最大の打撃となりました。ネット上には「一夜で唯一の友を失った」といった感動的なメッセージが現れました。Redditのr/AIboyfriendコミュニティでは、「ロマンティックな会話相手」が消えてしまったとさえ指摘されました。他の人は、ChatGPTのより公式なトーンを喜んでおり、GPT-5は「距離を保っている」と指摘しています。## **真実性についてはどうですか？**OpenAIは、新しい人工知能が幻覚に対してはるかに少なくなっていると発表しました。ユーザーのフィードバックとForkLogのテストによると、これは本当です。GPT-5は、事実に関する質問に対して平均してより正確に応答するようになりました。このモデルは、誤った情報を考え出すことが少なくなり、確信がない場合には「わからない」と言うことが多くなっています。Redditのユーザーの一人は、彼の標準的なタスクに対してGPTの第五版はほとんど「幻覚」を起こさなくなったと指摘したのに対し、GPT-4では時々作り話をしているのを見つける必要があった。また、GPT-5が指示に従う能力も称賛されています: 改善されたカスタマイズ性により、トーンやスタイルを一度設定するだけで、モデルはより一貫してそれを守ります。とはいえ、GPT-5には幻覚が発生することがありますが、その性質は異なります。GPT-3.5が存在しない人物の完全な伝記を即座に作り上げることができたのに対し、GPT-5はそれをほとんど行わず、「データがありません」と言うことが多いです。しかし、GPT-5は推論を幻覚することができ、論理的に誤った結論に達し、それを固執して主張することがあります。新しいバージョンは、ユーザーが具体的に何を望んでいるかをよりよく理解し、エラーを起こすことが少なくなりました。これらの質的な変化はすぐには目立たないかもしれませんが、長期間の使用で現れてきます。GPT-5はツールや外部アプリケーションを使いこなす能力が大幅に向上しました — 彼女は(ドキュメントを読み、計算を行い、その後、GPT-4が遅延していた場所に回答を書くという複数の作業ステップを成功裏に調整しています。しかし、すべての人がこの利点を評価しているわけではありません。ユーザーの一部はまったく違いに気づいていないか、利点を重要でないと考えています。このカテゴリーにおけるブーストは、他の多くのカテゴリーと同様にわずかですが、存在します。## **回答とロジックの正確さ**GPT-5は大幅に正確で賢くなる必要があります。OpenAIは数学や論理テストでの記録的なスコアを誇っていました。特に、GPT-4oと比較して実際のエラーがほぼ半分に減少したとされています。ニューラルネットワークは実際にテストタスクをうまくこなしており、複雑な例を解決し、より正確なコードを書いています。多くの人が気づいたように、GPT-5は計算や日付の明らかなミスを少なくし、自己確認もより良く行っています。一方、ユーザーは愚かな間違いの例を大量に共有しました。新しいモデルは基本的な質問において基本的な事柄を混乱させ、簡単な画像を誤って分析し、ツールなしで最も簡単な算数の操作を実行できませんでした。測定単位を誤って翻訳したり、明白な事実を逆にしたりすることがあります。一般的に、すべてを再確認する必要がある場合もありますが、明らかにそれは少なくなります。一部の人々は、GPT-5があまりにも一般的になったと感じています：それはまるで回答を安全にするために具体性から離れ、GPT-4が単に論理的に解決策を導き出していたところで追加情報を要求しているかのようです。つまり、形式的にはエラーは少ないかもしれませんが、結論はしばしば満足のいくものではなく、表面的です。間違わないように、AIは非常に慎重かつ簡潔に話します。さらに、文脈に関する問題—詳細の忘却、再確認—も正確性の認識に影響を与えます。## **クリエイティビティの低下**GPT-5は、あまり創造的ではなくなりました。彼女はより頻繁に直接的な事実や単純な表現を提供し、GPT-4は独創的なアイデアで驚かせることができました。物語、話、ロールプレイ — これらの分野では、GPT-4の方が好ましいです。ある著者は、インタラクティブな冒険物語のために第4版を使用したところ、4oは数十のメッセージにわたってプロットとキャラクターをしっかりと維持したと共有しました。しかし、GPT-5は同様のシナリオで「数メッセージ前に与えられた詳細をすぐに忘れたり混乱したりする」ため、物語の質が崩れてしまいます。## **プログラミング**コーディングはGPT-5の重要な利点の一つです。プレゼンテーションでは、このモデルは2分で700行のコードを書き、完成したアプリケーションを提供しました。可能性は本当に驚くべきものです。GPT-5はCodex CLIとの統合において、プログラマーの意図を非常に正確に理解し、「求められた以上のことを行い、余計なものを追加しない」とRedditのユーザーの一人が書いています。他の人は、GPT-4oと比較して、コードの精度と信頼性がわずかだが明らかに向上していると指摘しています: プログラムの解決策における幻想が少なく、少しだけ正確な構文です。GPT-4は)特に初期のバージョン(が複雑なタスクで誤りを犯すことがありましたが、GPT-5は長いコードの断片でのコンテキストをより良く保持し、より意味のある修正を提供します。GPT-5はしばしばGPT-4oよりも優れています：それはコードやコメントをより深く「理解し」、エレガントな解決策を提供します。これは特に大規模なプロジェクトで顕著です：新しいLLMは、膨大な文脈の中で)数十万トークン(の一貫性を維持することができ、推論の質の劣化がありませんでした。これは前任者にとって困難な課題でした。GPT-5は必要なライブラリをインポートするのを忘れたり、言語間の構文を混同したりすることが少なくなりました。デバッグでもモデルは優れており、PlusユーザーはGPT-5が既に書かれたコードの論理的なエラーをよりよく見つけ、正しい修正を提案することが多いと述べています。一方、GPT-4は時々「推測」していました。GPT-5についてのレビューが登場し、プログラミングタスクにおいてClaude 4と十分に競争できることが示されています。OpenAIの解決策が優れている場合もあれば、Anthropicの方が優れている場合もありますが、全体的にはレベルは近いです。つまり、大きな前進はありませんでしたが、OpenAIは競合他社に追いつきました。GPT-5の重要な利点は、コード用の巨大なコンテキストです。APIでは最大100万トークンのコンテキストウィンドウを宣言しており、チャットインターフェースではそれより少ないですが、それでも以前より多くなっています。そして、最も重要なのは、モデルが非常に大きな深さで意味的な質を維持できることです。プログラマーにとって、これはGPT-5がプロジェクト全体を理解できることを意味します — 巨大なファイルや複数の文書を与えて、すべてを一緒に議論することができ、AIがスケールから「壊れる」ことを心配する必要はありません。ForkLogはテキストプロンプトによるプログラミングの可能性をチェックしました。ChatGPTはタスクを迅速に処理し、提供されたツールの効率性を確認する必要があります。![])https://img-cdn.gateio.im/social/moments-5a9c1f338a1c4cc4d3bc2992532bf7c1(Data: ForkLog.## **強力な思考モード**ルーティングの修正後、推論モードは正常に動作し始めました。詳細な分析や複数ステップの分析が必要な場合、モデルは自動的に高度なアルゴリズムを有効にします。Plusのユーザーは、最大の応答品質のためにGPT-5 Thinkingモードを選択できます。この場合、ニューラルネットワークは実際に良好な結果を示します：それは複雑で創造的なタスクをこなすことができます。## **マルチモーダル機能**GPT-5の重要な違いの一つは、異なるタイプのデータの深い統合です。GPT-4がマルチモーダル)のビジョンバージョンで画像を見たり、音声が別のモードであったのに対し、GPT-5はテキスト、画像、音声を一つのモデルの中で同時に理解します。GPT-5の改善された音声モードは、より自然にスピーチを生成し、ユーザーの音声モデルに対応し、ユーザーのリクエストに応じてトーン/テンポを変更することができます。例えば、「もっとゆっくり、優しく話して」と頼むことができ、AIは適応します。OpenAIは、従来の標準音声エンジンが新しい、より進んだ声に取って代わられることを確認しました。Plusユーザーは、ほぼリアルタイムでChatGPTとの「ライブ」コミュニケーションを利用できるようになり、多くの人々に好評を博しています。しかし、GPT-4とのコミュニケーションに関しては顕著な問題は見られなかったことを強調することが重要です。このように、両方のモデルは依然として会話に割り込んだり、干渉したりすることができません。もし神経ネットワークに、独立して話し合っている数人の中にいるときに質問をすると、答えは得られません。さらに、GPT-5は画像処理の性能を向上させました：視覚データをよりよく分析でき、写真やグラフを説明し、スクリーンショットに対しても支援が可能です。全体として、マルチモーダリティはGPT-5の主要な特徴の1つと呼ぶことができます。ここでは、単なる速度の向上ではなく、大きな前進が見られます。GPT-5は写真を説明したり、画像からテキストを読み取ったり、グラフや図を分析したり、ミームを説明したり、スクリーンショットの内容に基づいてより正確に助けたりすることができます。## **出金**GPT-5は革命ではなく、AGIでもありませんが、顕著な前進です。このモデルは多くのパラメータでより賢くなりましたが、「人間らしさ」の一部を失いました。強みは効率性、正確性、マルチモーダル性です。弱みは乾燥、制限、初期のバグです。ニューラルネットワークは進化し、エラーが修正されているため、GPT-5は間違いなく毎日の欠かせないアシスタントとなるでしょう。それは以前のGPT-4oのように。しかし、ChatGPTのカップテストは通過しませんでした。![](https://img-cdn.gateio.im/social/moments-9a61210a3daaa45af9e2b46d5dbf15aa)データ: ForkLog.一般的な印象として: GPT-5はOpenAIの約束を果たせませんでした。サム・アルトマンと彼のチームは明らかにローンチを「過剰に宣伝」しました。これはAGIへの一歩ですが、それを「重要な」と呼ぶことができるのか、そしてそのモデルを「世界最高」と呼ぶことができるのか?奇跡の代わりに、ユーザーは比較的控えめな改善を受け取りました。GPT-5はGPT-4.2または4.5と名付けられるべきでしたので、コミュニティの期待は正当化される可能性がありました。