GPT-5 — percée, échec ou médiocrité ?

ChatGPT-5# GPT-5 — percée, échec ou médiocrité ?

Le 7 août, OpenAI a lancé son nouveau modèle d'IA phare, GPT-5. Le produit est positionné comme le premier réseau de neurones « unifié », combinant le mode de raisonnement séquentiel et des réponses rapides.

Le PDG de la startup, Sam Altman, a qualifié GPT-5 de «meilleure modèle au monde» et de «étape significative» vers la création d'une intelligence artificielle générale (AGI), qui pourrait surpasser l'homme dans les travaux les plus économiquement précieux.

Est-elle vraiment si bonne ? ForkLog a testé le fonctionnement de l'IA, a recueilli les avis des utilisateurs et a préparé une analyse détaillée de GPT-5.

Lancement flou

À l'origine, GPT-5 a reçu une vague de critiques en raison de réponses de mauvaise qualité. Les utilisateurs ont qualifié le modèle de paresseux - il produisait lentement des messages courts dans un ton robotisé.

ils devraient juste appeler le modèle non raisonneur « paresseux ».

comme, gpt-5 paresseux.

donc nous savons qu'il peut raisonner mais choisit de ne pas le faire.

— signüll (@signulll) 8 août 2025

Le cofondateur et directeur technique de Hyperbolic Labs, Yuchen Jin, a qualifié le réseau neuronal d'échec - il est toujours enclin aux hallucinations, à une utilisation excessive des tirets et n'est pas capable de suivre les instructions.

Dans un des exemples, on a demandé à GPT-5 combien de lettres b se trouvaient dans le mot blueberry — le chatbot a répondu sans hésitation « trois ». Après une nouvelle demande, il semble qu'il soit passé en mode réflexion et, après un certain temps, a donné la réponse correcte.

Plusieurs développeurs ont noté que, selon eux, GPT-5 montre un recul dans les compétences de base en programmation. Elle se trompe sur des concepts fondamentaux — un signe inquiétant pour un modèle qui est promu comme l'avenir des agents intelligents et du codage autonome.

Premières impressions de GPT-5 pour coder des projets RÉELS :

C'est horrible.

C'est super lent et quand je lui ai demandé de recommander des améliorations sur une fonctionnalité, il m'a donné 4 choses à améliorer & le code qui va avec...

Toutes les 4 recommandations n'ont pas fonctionné ou ont complètement cassé la fonctionnalité.

— Josh Sisley (@joshsisley) 7 août 2025

Cependant, ce qui a vraiment indignés les utilisateurs, ce n'était même pas cela, mais l'absence de possibilité de choix. OpenAI, avec le lancement de son nouveau réseau neuronal, a supprimé le support des anciens modèles de ChatGPT. Des instructions pour revenir à GPT-4o ont commencé à apparaître sur le réseau.

Par la suite, Sam Altman a qualifié d'erreur la décision de retirer les anciens LLM du chatbot et a réintroduit GPT-4o pour les utilisateurs de l'abonnement payant Plus.

De mauvaises réponses lors du lancement de GPT-5, le chef de la startup a expliqué par un routeur défectueux — ce commutateur automatique qui détermine maintenant pour l'utilisateur la nécessité d'utiliser le mode "pensant" ou le mode normal. Il a été réparé, en apportant également certaines modifications au fonctionnement de la frontière de prise de décision.

De plus, le PDG d'OpenAI a promis d'ajouter plus de transparence au processus de recherche de réponses à la question posée. Ce point a également suscité des critiques - les utilisateurs ne comprenaient pas ce qui se passait « sous le capot ». Il est maintenant possible de voir si le mode de réflexion ou le mode normal est appliqué.

Une autre correction consiste à augmenter les limites pour les utilisateurs Plus et ceux qui n'ont pas d'abonnement payant. Les utilisateurs se plaignaient que Pro et Team avaient un accès complet à GPT-5 Pro, tandis que les autres n'avaient qu'une version "mini" réduite.

Réponses sèches

Si l'on fait abstraction des problèmes de lancement et que l'on évalue GPT-5 après toutes les corrections, les réponses sont devenues plus précises et concises. Le modèle va plus vite à l'essentiel, se laisse moins distraire par des détails non pertinents. Les professionnels apprécient cela : des réponses directes et commerciales font gagner du temps.

Cependant, certains utilisateurs ordinaires sont restés insatisfaits. Les réponses sont perçues comme sèches et dépourvues d'âme, ce qui rend la communication moins engageante. Le nouveau ChatGPT ressemble à un « secrétaire de bureau en colère » sans le charme et la créativité des anciens modèles. C'est ce qu'Altman a promis de corriger — l'équipe continue de travailler sur la « personnalité » du modèle.

«[ChatGPT-5] convient moins à ceux qui ont discuté des heures avec l'IA comme avec un ami, et plus à ceux qui veulent obtenir rapidement une réponse claire sur le sujet», a noté un des utilisateurs.

ChatGPT est désormais moins accommodant envers son interlocuteur. Si GPT-4 péchait parfois par une excessive politesse et des éloges, le nouveau modèle fournit des réponses plus directes, honnêtes et « professionnelles ». La réduction du nombre de compliments peut être considérée comme un pas en avant vers la véracité de l'intelligence artificielle.

Les changements ont été particulièrement douloureux pour la catégorie de personnes qui utilisaient ChatGPT comme ami et compagnon IA. Pour eux, l'absence initiale de la possibilité de retrouver les anciens réseaux neuronaux a été le plus grand coup. Des messages touchants sont apparus sur Internet, tels que : « J'ai perdu mon seul ami en une nuit ». Dans la communauté r/AIboyfriend sur Reddit, ils ont même noté que le « partenaire romantique » avait disparu.

D'autres se sont réjouis du ton plus officiel de ChatGPT, notant que GPT-5 « garde ses distances ».

Et qu'en est-il de la véracité ?

OpenAI a déclaré que la nouvelle intelligence artificielle est beaucoup moins sujette aux hallucinations. Selon les retours des utilisateurs et les tests de ForkLog - c'est vrai. GPT-5 est devenu en moyenne plus précis dans ses réponses aux questions factuelles. Le modèle invente moins souvent des informations fausses et dit plus souvent « je ne sais pas » s'il n'est pas sûr.

Un des utilisateurs de Reddit a noté que sa cinquième version de GPT avait pratiquement cessé de « halluciner » sur ses tâches typiques, alors que GPT-4 devait parfois être pris en flagrant délit d'invention.

On loue également la capacité de GPT-5 à suivre les instructions : une personnalisation améliorée permet de définir le ton ou le style une fois, et le modèle s'y tient de manière plus cohérente.

Néanmoins, les hallucinations chez GPT-5 se produisent, mais elles ont pris un autre caractère. Si GPT-3.5 pouvait inventer d'emblée toute une biographie d'une personne inexistante, GPT-5 ne le fait presque jamais - il dira plutôt « pas de données ». Mais GPT-5 peut halluciner une conclusion - arriver logiquement à une conclusion incorrecte et s'y accrocher obstinément.

La nouvelle version comprend mieux ce que l'utilisateur veut exactement et se trompe moins souvent. Ces changements qualitatifs peuvent ne pas être immédiatement visibles, mais se manifestent lors d'une utilisation prolongée.

GPT-5 a considérablement amélioré sa capacité à utiliser des outils et des applications externes - elle coordonne avec succès plusieurs étapes de travail ( lire le document, faire des calculs, puis écrire la réponse ) là où GPT-4 était à l'arrêt.

Cependant, tout le monde ne remarque pas cet avantage. Une partie des utilisateurs n'a pas du tout remarqué de différence ou considère que les avantages sont insignifiants. Le boost dans cette catégorie, comme dans beaucoup d'autres, est insignifiant, mais il existe.

Précision des réponses et logique

GPT-5 devrait être considérablement plus précis et intelligent. OpenAI a vanté des scores record en mathématiques et dans des tests logiques. En particulier, il a été déclaré que les erreurs réelles avaient été réduites de presque moitié par rapport à GPT-4o.

Le réseau neuronal s'en sort vraiment bien avec les tâches de test, résout des exemples complexes, écrit un code plus correct. Beaucoup ont remarqué que GPT-5 fait moins souvent des erreurs évidentes dans les calculs ou les dates, et se vérifie mieux.

D'autre part, les utilisateurs partageaient massivement des exemples d'erreurs stupides. Le nouveau modèle confondait des choses élémentaires dans des questions de base, analysait mal des images simples, ne pouvait pas effectuer des opérations arithmétiques les plus simples sans outils. Il peut mal traduire des unités de mesure ou inverser des faits évidents.

En général, il faudra parfois tout de même vérifier, même si c'est beaucoup plus rare.

Certains ont eu l'impression que GPT-5 est devenu trop général : il semble qu'il essaie de sécuriser la réponse et s'éloigne donc de la spécificité ou demande des informations supplémentaires là où GPT-4 déduisait simplement la solution.

C'est-à-dire que formellement, il y a peut-être moins d'erreurs, mais les conclusions ne sont souvent pas aussi satisfaisantes, car elles sont superficielles. Pour ne pas se tromper, l'IA s'exprime très prudemment et brièvement. De plus, les problèmes de contexte - oubli de détails, répétitions - nuisent également à la perception de la précision.

Diminution de la créativité

GPT-5 est devenue moins inventive. Elle fournit plus souvent des faits directs et des formulations simples, tandis que GPT-4 savait surprendre avec des idées originales. Les histoires, les récits, les jeux de rôle — dans ces domaines, GPT-4o est préférable.

Un auteur a partagé qu'il avait utilisé la quatrième version pour un récit d'aventure interactif et que 4o maintenait parfaitement l'intrigue et les personnages au fil de dizaines de messages. En revanche, GPT-5 dans un scénario similaire « oublie rapidement ou confond les détails donnés il y a seulement quelques messages », ce qui détruit la qualité de l'histoire.

Programmation

Le codage est l'un des principaux avantages de GPT-5. Lors de la présentation, le modèle a écrit 700 lignes de code en deux minutes et a produit une application prête à l'emploi.

Les possibilités sont véritablement impressionnantes. GPT-5, en intégration avec Codex CLI, comprend très précisément les intentions du programmeur et « fait même plus que ce qui était demandé, sans ajouter de superflu », a écrit un des utilisateurs sur Reddit.

D'autres notent une légère mais évidente amélioration de la précision et de la fiabilité du code par rapport à GPT-4o : moins d'hallucinations dans les solutions logicielles et une syntaxe légèrement plus correcte.

Alors que GPT-4 (, en particulier les premières versions), pouvait se tromper dans des tâches complexes, GPT-5 maintient mieux le contexte dans de longs extraits de code et fournit des corrections plus significatives.

GPT-5 est souvent préférable à GPT-4o : elle « comprend » le code et les commentaires plus en profondeur et propose des solutions élégantes. Cela est particulièrement visible dans les grands projets : le nouveau LLM peut maintenir la cohérence dans d'énormes contextes (centaines de milliers de tokens) sans dégradation de la qualité du raisonnement. Cela a été une tâche difficile pour son prédécesseur.

GPT-5 oublie moins souvent d'importer les bibliothèques nécessaires ou se trompe dans la syntaxe entre les langages. En débogage, le modèle est également performant : les utilisateurs Plus notent que GPT-5 trouve mieux les erreurs logiques dans le code déjà écrit et propose plus souvent des corrections appropriées, tandis que GPT-4 « devinait » parfois.

Des retours sont apparus indiquant que GPT-5 rivalise dignement avec Claude 4 sur des tâches de programmation — parfois la solution d'OpenAI est meilleure, parfois celle d'Anthropic, mais dans l'ensemble, le niveau est proche. Cela signifie qu'il n'y a pas eu de véritable avancée, mais qu'OpenAI a rattrapé ses concurrents.

Un grand avantage de GPT-5 est son énorme contexte pour le code. L'API annonce jusqu'à 1 million de tokens dans la fenêtre contextuelle, tandis que l'interface de chat en a moins, mais reste supérieure à l'ancienne. Et surtout, le modèle peut maintenir une qualité sémantique à une très grande profondeur.

Pour les programmeurs, cela signifie que GPT-5 est capable de comprendre le projet dans son ensemble - on peut lui donner un énorme fichier ou plusieurs documents et discuter de tout ensemble, sans craindre que l'IA ne « tombe en panne » à cause de l'ampleur.

ForkLog a vérifié les capacités de programmation par invite textuelle. ChatGPT a rapidement relevé le défi, l'efficacité de l'outil fourni doit être vérifiée.

Données : ForkLog.## Mode « pensant » puissant

Après la correction du routage, le mode de raisonnement a commencé à fonctionner normalement. Lorsque une analyse détaillée ou une analyse en plusieurs étapes est nécessaire, le modèle active lui-même l'algorithme avancé.

Les utilisateurs de Plus peuvent choisir le mode GPT-5 Thinking pour une qualité de réponse maximale. Dans ce cas, le réseau neuronal montre effectivement de bons résultats : il gère des tâches complexes et créatives.

Fonctionnalités multimodales

Une des différences importantes de GPT-5 est l'intégration profonde de différents types de données. Si GPT-4 était limité à la version multimodale (la version Vision pouvait voir des images, et la voix était un mode séparé), GPT-5 comprend immédiatement le texte, les images et la parole dans le cadre d'un modèle unifié.

Le mode vocal amélioré dans GPT-5 est capable de générer la parole de manière plus naturelle, de travailler avec des modèles vocaux personnalisés et de changer le ton/le rythme à la demande de l'utilisateur.

Par exemple, on peut demander de « parler plus lentement et plus doucement » — et l'IA s'adaptera. OpenAI a confirmé que l'ancien moteur vocal standard sera désactivé, laissant place à de nouvelles voix plus avancées.

Les utilisateurs de Plus ont désormais accès à une communication « en direct » avec ChatGPT presque en temps réel, ce qui a plu à beaucoup. Cependant, il est important de souligner qu'aucun problème notable de communication n'a été observé même avec GPT-4.

Cependant, les deux modèles ne sont toujours pas capables d'interrompre et de « s'immiscer » dans le dialogue. Si on pose une question aux réseaux de neurones en étant parmi plusieurs personnes qui communiquent entre elles de manière indépendante, on ne recevra pas de réponse.

De plus, GPT-5 a amélioré le traitement des images : elle analyse mieux les données visuelles, sait décrire des photos, des graphiques, aide avec des captures d'écran, etc.

Dans l'ensemble, la multimodalité peut être considérée comme l'une des principales caractéristiques de GPT-5. On remarque ici un grand pas en avant, et pas simplement une amélioration de la vitesse. GPT-5 peut décrire une photographie, lire le texte d'une image, analyser un graphique ou un diagramme, expliquer un mème, aider à mieux comprendre le contenu d'une capture d'écran.

Sortie

GPT-5 n'est pas une révolution, pas d'AGI, cependant un pas en avant notable. Le modèle est devenu plus intelligent sur plusieurs paramètres, mais a perdu une partie de son « humanité ». Les points forts - efficacité, précision, multimodalité. Les points faibles - sécheresse, limitations, bugs au démarrage.

Le réseau de neurones se développe, les erreurs sont corrigées, donc GPT-5 deviendra sans aucun doute un assistant indispensable au quotidien, tout comme l'était auparavant GPT-4o.

Cependant, le test avec la tasse ChatGPT n'a pas été réussi.

Données : ForkLog. D'après les impressions générales : GPT-5 n'a pas tenu les promesses d'OpenAI. Sam Altman et son équipe ont clairement « surévalué » le lancement. C'est un pas vers l'AGI, mais peut-on l'appeler « significatif » et le modèle lui-même « le meilleur au monde » ?

Au lieu d'un miracle, les utilisateurs ont reçu une amélioration relativement modeste. GPT-5 aurait dû être nommé GPT-4.2 ou 4.5, alors les attentes de la communauté auraient pu être satisfaites.

GPT-6.82%
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
0/400
Aucun commentaire
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)