في 7 أغسطس، أصدرت OpenAI نموذج الذكاء الاصطناعي الرائد الجديد GPT-5. يتم تسويق المنتج كأول شبكة عصبية "موحدة" تجمع بين وضع التفكير المتسلسل والإجابات السريعة.
وصف الرئيس التنفيذي للشركة الناشئة سام ألتمان GPT-5 بأنها "أفضل نموذج في العالم" و "خطوة كبيرة" نحو إنشاء ذكاء اصطناعي عام (AGI) يمكن أن يتفوق على الإنسان في أكثر الأعمال الاقتصادية قيمة.
هل هي جيدة حقًا؟ اختبرت ForkLog أداء الشبكة العصبية، وجمعت آراء المستخدمين وأعدت تحليلًا مفصلًا لـ GPT-5.
إطلاق سلس
في البداية، تلقت GPT-5 سيلًا من الانتقادات بسبب ردودها غير الجيدة. واعتبر المستخدمون النموذج كسولًا - حيث كان يخرج رسائل قصيرة بنغمة آلية ببطء.
يجب عليهم فقط تسمية نموذج عدم التفكير "كسول."
مثل، جي بي تي-5 كسول.
لذا نعلم أنه يمكنه التفكير لكنه يختار عدم القيام بذلك.
— signüll (@signulll) 8 أغسطس 2025
أطلق يوتشين جين، المؤسس المشارك ومدير التكنولوجيا في Hyperbolic Labs، على الشبكة العصبية لقب الفاشلة - لا تزال عرضة للهلاوس، والاستخدام المفرط للشرطات، وغير قادرة على اتباع التعليمات.
في أحد الأمثلة، سُئل GPT-5 عن عدد حرف b الموجود في كلمة blueberry - رد روبوت الدردشة دون تردد "ثلاثة". بعد الطلب مرة أخرى، يبدو أنه دخل في وضع التفكير وبعد بعض الوقت أعطى الإجابة الصحيحة.
لاحظ عدد من المطورين أنه، في رأيهم، يظهر GPT-5 تراجعًا في المهارات الأساسية للبرمجة. إنها تخطئ في المفاهيم الأساسية - علامة مقلقة للنموذج الذي يُعلن عنه كمستقبل الوكلاء الذكيين والترميز المستقل.
الانطباعات الأولى عن GPT-5 لبرمجة المشاريع الحقيقية:
إنه رهيب.
إنه بطيء للغاية وعندما طلبت منه اقتراح تحسينات على ميزة، أعطاني 4 أشياء لتحسينها وشفرة البرمجة المناسبة لذلك....
جميع التوصيات الأربعة إما لم تعمل أو أفسدت الميزة تمامًا.
— جوش سيسلي (@joshsisley) 7 أغسطس 2025
ومع ذلك، استاء المستخدمون ليس من ذلك فحسب، بل من عدم وجود خيار للاختيار. قامت OpenAI مع إطلاق الشبكة العصبية الجديدة بإزالة دعم النماذج القديمة من ChatGPT. بدأت التعليمات تظهر على الشبكة حول كيفية استرجاع GPT-4o.
في وقت لاحق، وصف سام ألتمان قرار إزالة نماذج اللغة الكبيرة القديمة من الدردشة بأنه خطأ وأعاد GPT-4o لمستخدمي الاشتراك المدفوع Plus.
أجاب المدير التنفيذي لشركة ستارت أب عن انطلاق GPT-5 بأسئلة سيئة بشأن جهاز التوجيه المعطل - وهو مفتاح التبديل التلقائي الذي يحدد الآن عن المستخدم ما إذا كان يجب استخدام الوضع "المفكر" أو الوضع العادي. تم إصلاحه، مع إجراء بعض التعديلات الإضافية على عمل حدود اتخاذ القرار.
بالإضافة إلى ذلك، وعد الرئيس التنفيذي لشركة OpenAI بإضافة المزيد من الشفافية في عملية البحث عن إجابة للسؤال المطروح. وقد أثار هذا الأمر أيضًا انتقادات - حيث لم يفهم المستخدمون ما يحدث "تحت الغطاء". الآن يمكن رؤية ما إذا كان يتم تطبيق وضع التفكير أو الوضع العادي.
تصحيح آخر هو زيادة الحدود للمستخدمين Plus وأولئك الذين ليس لديهم اشتراك مدفوع. اشتكى المستخدمون من أن Pro وTeam يحصلون على وصول كامل إلى GPT-5 Pro، بينما يحصل الآخرون فقط على "نسخة مصغرة".
إجابات جافة
إذا استبعدنا المشكلات المتعلقة بالإطلاق وقيّمنا GPT-5 بعد جميع التصحيحات، أصبحت الإجابات أكثر دقة وإيجازًا. النموذج ينتقل بسرعة إلى جوهر الموضوع، ويقلل من الانشغال بالتفاصيل غير ذات الصلة. يقدّر المحترفون ذلك: الإجابات المباشرة والعملية توفر الوقت.
ومع ذلك، لا يزال بعض المستخدمين العاديين غير راضين. تُعتبر الردود جافة وغير إنسانية، مما يجعل التواصل يبدو أقل جاذبية. يشبه ChatGPT الجديد "سكرتير مكتب غاضب" بدون سحر وإبداع النماذج القديمة. هذا ما وعد به ألتمان — تستمر الفريق في العمل على "شخصية" النموذج.
«[ChatGPT-5] أقل ملاءمة لأولئك الذين كانوا يتحدثون مع الذكاء الاصطناعي كصديق لساعات، وأكثر ملاءمة لأولئك الذين يريدون الحصول على إجابة واضحة وسريعة حول الموضوع»، كما أشار أحد المستخدمين.
تشات جي بي تي الآن أقل تملقًا للمحادث. إذا كانت GPT-4 أحيانًا تخطئ في الإفراط في المجاملات والثناء، فإن النموذج الجديد يقدم إجابات أكثر مباشرة وصدقًا و"عملية". يمكن اعتبار تقليل عدد المجاملات خطوة إلى الأمام في مصداقية الذكاء الاصطناعي.
كانت الفئة من الناس التي استخدمت ChatGPT كصديق ورفيق ذكاء اصطناعي هي الأكثر تأثراً بالتغييرات. بالنسبة لهم، كانت القدرة المفقودة على استعادة الشبكات العصبية القديمة هي الضربة الأكبر. ظهرت في الشبكة رسائل مؤثرة مثل: «لقد فقدت الصديق الوحيد في ليلة واحدة». في مجتمع r/AIboyfriend على Reddit، أشاروا إلى أن «المحادث الرومانسي» قد اختفى.
أشاد الآخرون بنغمة ChatGPT الأكثر رسمية، مشيرين إلى أن GPT-5 "يحافظ على المسافة".
ماذا عن المصداقية؟
أعلنت OpenAI أن الذكاء الاصطناعي الجديد أقل عرضة للهلاوس. وفقًا لتعليقات المستخدمين واختبارات ForkLog - هذه هي الحقيقة. أصبح GPT-5 أكثر دقة في المتوسط عند الإجابة على الأسئلة الواقعية. نادرًا ما تخترع النموذج معلومات غير صحيحة وغالبًا ما يقول "لا أعلم" إذا لم يكن متأكدًا.
أحد مستخدمي Reddit أشار إلى أن النسخة الخامسة من GPT قد توقفت تقريبًا عن "الهذيان" في مهامه النموذجية، بينما كان يتعين أحيانًا القبض على GPT-4 في الخيال.
كما يتم الإشادة بقدرة GPT-5 على اتباع التعليمات: تحسين القابلية للتخصيص يسمح بتحديد النغمة أو الأسلوب مرة واحدة، وتلتزم النموذج به بشكل أكثر اتساقًا.
ومع ذلك، تحدث الهلوسات في GPT-5، لكنها اكتسبت طابعًا مختلفًا. إذا كان بإمكان GPT-3.5 أن يخترع سيرة ذاتية كاملة لشخص غير موجود على الفور، فإن GPT-5 لا يفعل ذلك تقريبًا — بل من المحتمل أن يقول "لا توجد بيانات". لكن يمكن لـ GPT-5 أن يهلوس استنتاجًا — أن يصل منطقيًا إلى نتيجة خاطئة ويصر عليها.
الإصدار الجديد يفهم بشكل أفضل ما يريده المستخدم بالضبط، ويقلل من الأخطاء. قد لا تكون هذه التغييرات النوعية ملحوظة على الفور، لكنها تظهر مع الاستخدام المطول.
لقد زادت قدرة GPT-5 بشكل كبير على استخدام الأدوات والتطبيقات الخارجية - حيث تنسق بنجاح عدة خطوات من العمل (قراءة الوثيقة، إجراء الحسابات، ثم كتابة الرد) في الأماكن التي كانت GPT-4 تعاني فيها.
ومع ذلك، لا يلاحظ الجميع هذه الميزة. بعض المستخدمين لم يلاحظوا الفرق على الإطلاق أو يعتبرون المزايا غير ذات أهمية. التعزيز في هذه الفئة، كما هو الحال في العديد من الفئات الأخرى، ضئيل، لكنه موجود.
دقة الإجابات والمنطق
يجب أن تكون GPT-5 أكثر دقة وذكاءً بشكل ملحوظ. كانت OpenAI تتفاخر بالدرجات القياسية في الرياضيات والاختبارات المنطقية. على وجه الخصوص، تم الإبلاغ عن تقليص الأخطاء الفعلية تقريبًا إلى النصف مقارنةً بـ GPT-4o.
تتولى الشبكة العصبية فعلاً مهام الاختبار بشكل جيد، وتحل الأمثلة المعقدة، وتكتب شيفرات أكثر دقة. لاحظ الكثيرون أن GPT-5 ترتكب أخطاء واضحة في الحسابات أو التواريخ بشكل أقل، وتتحقق من نفسها بشكل أفضل.
من ناحية أخرى، كان المستخدمون يتشاركون بشكل جماعي أمثلة على الأخطاء السخيفة. كانت النموذج الجديد يخلط بين الأمور الأساسية في الأسئلة الأساسية، ويفسر الصور البسيطة بشكل غير صحيح، ولا يستطيع القيام بأبسط العمليات الحسابية بدون أدوات. يمكن أن يترجم وحدات القياس بشكل غير صحيح أو يخلط بين الحقائق الواضحة.
بشكل عام، سيتعين عليك أحيانًا التحقق مرة أخرى، رغم أنه بشكل ملحوظ أقل.
بدا لبعض الناس أن GPT-5 أصبحت عامة جدًا: كأنها تحاول تأمين الإجابة وبالتالي تبتعد عن التفاصيل أو تطلب معلومات إضافية حيث كانت GPT-4 ببساطة تستنتج الحل منطقيًا.
أي أنه بشكل رسمي قد تكون الأخطاء أقل، لكن الاستنتاجات غالباً ما تكون غير مرضية، لأنها سطحية. لتفادي الأخطاء، يتحدث الذكاء الاصطناعي بحذر شديد وباختصار. بالإضافة إلى ذلك، فإن المشاكل المتعلقة بالسياق - نسيان التفاصيل، وإعادة السؤال - تضرب أيضاً في إدراك الدقة.
انخفاض الإبداع
أصبح GPT-5 أقل إبداعًا. إنه غالبًا ما يقدم حقائق مباشرة وصيغ بسيطة، بينما كان GPT-4 قادرًا على إبهار الأفكار غير التقليدية. القصص، الروايات، ألعاب الأدوار - في هذه المجالات، يُفضل GPT-4.
شارك أحد المؤلفين أنه استخدم الإصدار الرابع لسرد قصة مغامرات تفاعلية، وأن 4o حافظ على الحبكة والشخصيات بشكل ممتاز على مدار عشرات الرسائل. بينما GPT-5 في سيناريو مشابه "ينسى أو يخلط التفاصيل بسرعة، مما تم تقديمه قبل رسالتين فقط"، مما يؤدي إلى تدهور جودة القصة.
برمجة
البرمجة هي واحدة من المزايا الرئيسية لـ GPT-5. في العرض التقديمي، كتبت النموذج 700 سطر من الشيفرة في دقيقتين وأصدرت تطبيقًا جاهزًا.
الفرص حقًا مذهلة. GPT-5 في التكامل مع Codex CLI يفهم بدقة نوايا المبرمج وحتى "يفعل أكثر مما طُلب، دون إضافة المزيد"، كتب أحد المستخدمين على Reddit.
يلاحظ آخرون زيادة طفيفة ولكن واضحة في دقة وموثوقية الكود مقارنةً مع GPT-4o: عدد أقل من الهلاوس في الحلول البرمجية وقواعد نحوية أكثر دقة قليلاً.
بينما كان GPT-4 ( وخاصة الإصدارات المبكرة) قد يخطئ في المهام المعقدة، فإن GPT-5 يحتفظ بالسياق بشكل أفضل في أجزاء طويلة من الكود ويقدم تصحيحات أكثر معنى.
GPT-5 غالبًا ما تكون مفضلة على GPT-4o: لأنها "تفهم" الكود والتعليقات بشكل أعمق وتقدم حلولًا أنيقة. هذا ملحوظ بشكل خاص في المشاريع الكبيرة: يمكن لـ LLM الجديدة الحفاظ على الترابط في سياقات هائلة (مئات الآلاف من الرموز) دون تدهور جودة الاستدلال. كانت هذه مهمة صعبة بالنسبة للسابقة.
GPT-5 أقل نسيانًا لاستيراد المكتبات الضرورية أو الخلط بين بناء الجملة بين اللغات. في تصحيح الأخطاء، النموذج أيضًا جيد: مستخدمو Plus يلاحظون أن GPT-5 يجد أخطاء منطقية بشكل أفضل في الشيفرة المكتوبة بالفعل ويقترح تصحيحات صحيحة بشكل متكرر، بينما كان GPT-4 أحيانًا "يخمن".
ظهرت تعليقات تفيد بأن GPT-5 يتنافس بجدارة مع Claude 4 في المهام البرمجية - في بعض الأحيان يكون الحل من OpenAI أفضل، وفي أحيان أخرى من Anthropic، ولكن بشكل عام المستوى قريب. بمعنى أنه لم يحدث تقدم كبير، لكن OpenAI لحق بالمنافسين.
الميزة المهمة في GPT-5 هي السياق الضخم للكود. في واجهة برمجة التطبيقات، يتم الإعلان عن ما يصل إلى 1 مليون رمز في نافذة السياق، وفي واجهة الدردشة - أقل، ولكن لا يزال أكثر من السابق. والأهم من ذلك - يمكن للنموذج الحفاظ على الجودة الدلالية على عمق كبير جدًا.
بالنسبة للمبرمجين، فهذا يعني أن GPT-5 قادر على فهم المشروع ككل - يمكن إعطاؤه ملفًا ضخمًا أو عدة مستندات ومناقشة كل شيء معًا، دون الخوف من أن "ينهار" الذكاء الاصطناعي بسبب الحجم.
ForkLog تحقق من إمكانيات البرمجة من خلال الموجه النصي. تمكن ChatGPT من تنفيذ المهمة بسرعة، ويجب التحقق من فعالية الأداة المقدمة.
! البيانات: ForkLog.## ** وضع التفكير القوي **
بعد إصلاح التوجيه، بدأ وضع التفكير يعمل بشكل طبيعي. عندما يكون هناك حاجة إلى تحليل مفصل أو تحليل متعدد الخطوات، تقوم النموذج بتفعيل الخوارزمية المتقدمة بنفسها.
يمكن لمستخدمي Plus اختيار وضع GPT-5 Thinking للحصول على أعلى جودة من الردود. في هذه الحالة، تُظهر الشبكة العصبية حقًا نتائج جيدة: فهي تتعامل مع المهام المعقدة والإبداعية.
إمكانات متعددة الوسائط
واحدة من الاختلافات المهمة في GPT-5 هي التكامل العميق لمختلف أنواع البيانات. إذا كانت GPT-4 محدودة في النسخة متعددة الوسائط (كان إصدار Vision قادرًا على رؤية الصور، وكانت الصوت وضعًا منفصلًا)، فإن GPT-5 تفهم النصوص والصور والكلام على الفور في إطار نموذج موحد.
تتمتع وضعية الصوت المحسنة في GPT-5 بقدرتها على توليد الكلام بشكل أكثر طبيعية، والعمل مع نماذج الصوت المخصصة، وتغيير النغمة/السرعة بناءً على طلب المستخدم.
على سبيل المثال، يمكنك أن تطلب "التحدث بشكل أبطأ وأكثر ليونة" - وسيتكيف الذكاء الاصطناعي. أكدت OpenAI أن محرك الصوت القياسي القديم سيتم إيقافه، ليحل محله أصوات جديدة وأكثر تقدمًا.
لمستخدمي Plus، أصبح متاحًا الآن التواصل "الحيوي" مع ChatGPT تقريبًا في الوقت الحقيقي، وهو ما نال إعجاب الكثيرين. ومع ذلك، من المهم التأكيد على أنه لم تُلاحظ مشاكل ملحوظة في التواصل حتى مع GPT-4.
لا تزال كلا النموذجين غير قادرين على مقاطعة أو "التدخل" في الحوار. إذا تم طرح سؤال على الشبكات العصبية أثناء وجودها بين عدة أشخاص يتحدثون مع بعضهم البعض بشكل مستقل، فلن تنتظر إجابة.
علاوة على ذلك، حسّنت GPT-5 العمل مع الصور: حيث تحلل البيانات البصرية بشكل أفضل، وتستطيع وصف الصور، والرسوم البيانية، وتقديم المساعدة بشأن لقطات الشاشة، وما إلى ذلك.
بشكل عام، يمكن اعتبار تعدد الوسائط واحدة من الميزات الرئيسية لـ GPT-5. هنا يظهر تقدم كبير، وليس مجرد تحسين للسرعة. يمكن لـ GPT-5 وصف صورة، وقراءة نص من صورة، وتحليل رسم بياني أو مخطط، وتوضيح ميم، ومساعدة في محتوى لقطة الشاشة بدقة أكبر.
الإخراج
GPT-5 — ليس ثورة، وليس AGI، ولكنه خطوة ملحوظة إلى الأمام. أصبحت النموذج أكثر ذكاءً من حيث عدد من المعايير، ولكنه فقد جزءاً من "الإنسانية". نقاط القوة هي الكفاءة، الدقة، التعددية الوسائط. نقاط الضعف هي الجفاف، القيود، الأخطاء في البداية.
تتطور الشبكة العصبية، ويتم تصحيح الأخطاء، لذلك سيكون GPT-5 بلا شك مساعدًا لا غنى عنه في كل يوم، كما كان سابقًا GPT-4o.
ومع ذلك، لم ينجح اختبار كوب ChatGPT.
البيانات: ForkLog.من الانطباعات العامة: لم تفي GPT-5 بوعود OpenAI. يبدو أن سام ألتمان وفريقه قد "بالغوا" في إطلاقها. إنها خطوة نحو AGI، لكن هل يمكن اعتبارها "مهمة"، والنموذج نفسه "الأفضل في العالم"؟
بدلاً من المعجزة، حصل المستخدمون على تحسين متواضع نسبيًا. كان يجب أن يسمى GPT-5 بـ GPT-4.2 أو 4.5، عندها كان من الممكن أن تتحقق توقعات المجتمع.
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
GPT-5 — احترافي، فشل أم وساطة؟
! ChatGPT-5# GPT-5 - اختراق أم فشل أم رداءة؟
في 7 أغسطس، أصدرت OpenAI نموذج الذكاء الاصطناعي الرائد الجديد GPT-5. يتم تسويق المنتج كأول شبكة عصبية "موحدة" تجمع بين وضع التفكير المتسلسل والإجابات السريعة.
وصف الرئيس التنفيذي للشركة الناشئة سام ألتمان GPT-5 بأنها "أفضل نموذج في العالم" و "خطوة كبيرة" نحو إنشاء ذكاء اصطناعي عام (AGI) يمكن أن يتفوق على الإنسان في أكثر الأعمال الاقتصادية قيمة.
هل هي جيدة حقًا؟ اختبرت ForkLog أداء الشبكة العصبية، وجمعت آراء المستخدمين وأعدت تحليلًا مفصلًا لـ GPT-5.
إطلاق سلس
في البداية، تلقت GPT-5 سيلًا من الانتقادات بسبب ردودها غير الجيدة. واعتبر المستخدمون النموذج كسولًا - حيث كان يخرج رسائل قصيرة بنغمة آلية ببطء.
أطلق يوتشين جين، المؤسس المشارك ومدير التكنولوجيا في Hyperbolic Labs، على الشبكة العصبية لقب الفاشلة - لا تزال عرضة للهلاوس، والاستخدام المفرط للشرطات، وغير قادرة على اتباع التعليمات.
في أحد الأمثلة، سُئل GPT-5 عن عدد حرف b الموجود في كلمة blueberry - رد روبوت الدردشة دون تردد "ثلاثة". بعد الطلب مرة أخرى، يبدو أنه دخل في وضع التفكير وبعد بعض الوقت أعطى الإجابة الصحيحة.
لاحظ عدد من المطورين أنه، في رأيهم، يظهر GPT-5 تراجعًا في المهارات الأساسية للبرمجة. إنها تخطئ في المفاهيم الأساسية - علامة مقلقة للنموذج الذي يُعلن عنه كمستقبل الوكلاء الذكيين والترميز المستقل.
ومع ذلك، استاء المستخدمون ليس من ذلك فحسب، بل من عدم وجود خيار للاختيار. قامت OpenAI مع إطلاق الشبكة العصبية الجديدة بإزالة دعم النماذج القديمة من ChatGPT. بدأت التعليمات تظهر على الشبكة حول كيفية استرجاع GPT-4o.
في وقت لاحق، وصف سام ألتمان قرار إزالة نماذج اللغة الكبيرة القديمة من الدردشة بأنه خطأ وأعاد GPT-4o لمستخدمي الاشتراك المدفوع Plus.
أجاب المدير التنفيذي لشركة ستارت أب عن انطلاق GPT-5 بأسئلة سيئة بشأن جهاز التوجيه المعطل - وهو مفتاح التبديل التلقائي الذي يحدد الآن عن المستخدم ما إذا كان يجب استخدام الوضع "المفكر" أو الوضع العادي. تم إصلاحه، مع إجراء بعض التعديلات الإضافية على عمل حدود اتخاذ القرار.
بالإضافة إلى ذلك، وعد الرئيس التنفيذي لشركة OpenAI بإضافة المزيد من الشفافية في عملية البحث عن إجابة للسؤال المطروح. وقد أثار هذا الأمر أيضًا انتقادات - حيث لم يفهم المستخدمون ما يحدث "تحت الغطاء". الآن يمكن رؤية ما إذا كان يتم تطبيق وضع التفكير أو الوضع العادي.
تصحيح آخر هو زيادة الحدود للمستخدمين Plus وأولئك الذين ليس لديهم اشتراك مدفوع. اشتكى المستخدمون من أن Pro وTeam يحصلون على وصول كامل إلى GPT-5 Pro، بينما يحصل الآخرون فقط على "نسخة مصغرة".
إجابات جافة
إذا استبعدنا المشكلات المتعلقة بالإطلاق وقيّمنا GPT-5 بعد جميع التصحيحات، أصبحت الإجابات أكثر دقة وإيجازًا. النموذج ينتقل بسرعة إلى جوهر الموضوع، ويقلل من الانشغال بالتفاصيل غير ذات الصلة. يقدّر المحترفون ذلك: الإجابات المباشرة والعملية توفر الوقت.
ومع ذلك، لا يزال بعض المستخدمين العاديين غير راضين. تُعتبر الردود جافة وغير إنسانية، مما يجعل التواصل يبدو أقل جاذبية. يشبه ChatGPT الجديد "سكرتير مكتب غاضب" بدون سحر وإبداع النماذج القديمة. هذا ما وعد به ألتمان — تستمر الفريق في العمل على "شخصية" النموذج.
تشات جي بي تي الآن أقل تملقًا للمحادث. إذا كانت GPT-4 أحيانًا تخطئ في الإفراط في المجاملات والثناء، فإن النموذج الجديد يقدم إجابات أكثر مباشرة وصدقًا و"عملية". يمكن اعتبار تقليل عدد المجاملات خطوة إلى الأمام في مصداقية الذكاء الاصطناعي.
كانت الفئة من الناس التي استخدمت ChatGPT كصديق ورفيق ذكاء اصطناعي هي الأكثر تأثراً بالتغييرات. بالنسبة لهم، كانت القدرة المفقودة على استعادة الشبكات العصبية القديمة هي الضربة الأكبر. ظهرت في الشبكة رسائل مؤثرة مثل: «لقد فقدت الصديق الوحيد في ليلة واحدة». في مجتمع r/AIboyfriend على Reddit، أشاروا إلى أن «المحادث الرومانسي» قد اختفى.
أشاد الآخرون بنغمة ChatGPT الأكثر رسمية، مشيرين إلى أن GPT-5 "يحافظ على المسافة".
ماذا عن المصداقية؟
أعلنت OpenAI أن الذكاء الاصطناعي الجديد أقل عرضة للهلاوس. وفقًا لتعليقات المستخدمين واختبارات ForkLog - هذه هي الحقيقة. أصبح GPT-5 أكثر دقة في المتوسط عند الإجابة على الأسئلة الواقعية. نادرًا ما تخترع النموذج معلومات غير صحيحة وغالبًا ما يقول "لا أعلم" إذا لم يكن متأكدًا.
أحد مستخدمي Reddit أشار إلى أن النسخة الخامسة من GPT قد توقفت تقريبًا عن "الهذيان" في مهامه النموذجية، بينما كان يتعين أحيانًا القبض على GPT-4 في الخيال.
كما يتم الإشادة بقدرة GPT-5 على اتباع التعليمات: تحسين القابلية للتخصيص يسمح بتحديد النغمة أو الأسلوب مرة واحدة، وتلتزم النموذج به بشكل أكثر اتساقًا.
ومع ذلك، تحدث الهلوسات في GPT-5، لكنها اكتسبت طابعًا مختلفًا. إذا كان بإمكان GPT-3.5 أن يخترع سيرة ذاتية كاملة لشخص غير موجود على الفور، فإن GPT-5 لا يفعل ذلك تقريبًا — بل من المحتمل أن يقول "لا توجد بيانات". لكن يمكن لـ GPT-5 أن يهلوس استنتاجًا — أن يصل منطقيًا إلى نتيجة خاطئة ويصر عليها.
الإصدار الجديد يفهم بشكل أفضل ما يريده المستخدم بالضبط، ويقلل من الأخطاء. قد لا تكون هذه التغييرات النوعية ملحوظة على الفور، لكنها تظهر مع الاستخدام المطول.
لقد زادت قدرة GPT-5 بشكل كبير على استخدام الأدوات والتطبيقات الخارجية - حيث تنسق بنجاح عدة خطوات من العمل (قراءة الوثيقة، إجراء الحسابات، ثم كتابة الرد) في الأماكن التي كانت GPT-4 تعاني فيها.
ومع ذلك، لا يلاحظ الجميع هذه الميزة. بعض المستخدمين لم يلاحظوا الفرق على الإطلاق أو يعتبرون المزايا غير ذات أهمية. التعزيز في هذه الفئة، كما هو الحال في العديد من الفئات الأخرى، ضئيل، لكنه موجود.
دقة الإجابات والمنطق
يجب أن تكون GPT-5 أكثر دقة وذكاءً بشكل ملحوظ. كانت OpenAI تتفاخر بالدرجات القياسية في الرياضيات والاختبارات المنطقية. على وجه الخصوص، تم الإبلاغ عن تقليص الأخطاء الفعلية تقريبًا إلى النصف مقارنةً بـ GPT-4o.
تتولى الشبكة العصبية فعلاً مهام الاختبار بشكل جيد، وتحل الأمثلة المعقدة، وتكتب شيفرات أكثر دقة. لاحظ الكثيرون أن GPT-5 ترتكب أخطاء واضحة في الحسابات أو التواريخ بشكل أقل، وتتحقق من نفسها بشكل أفضل.
من ناحية أخرى، كان المستخدمون يتشاركون بشكل جماعي أمثلة على الأخطاء السخيفة. كانت النموذج الجديد يخلط بين الأمور الأساسية في الأسئلة الأساسية، ويفسر الصور البسيطة بشكل غير صحيح، ولا يستطيع القيام بأبسط العمليات الحسابية بدون أدوات. يمكن أن يترجم وحدات القياس بشكل غير صحيح أو يخلط بين الحقائق الواضحة.
بشكل عام، سيتعين عليك أحيانًا التحقق مرة أخرى، رغم أنه بشكل ملحوظ أقل.
بدا لبعض الناس أن GPT-5 أصبحت عامة جدًا: كأنها تحاول تأمين الإجابة وبالتالي تبتعد عن التفاصيل أو تطلب معلومات إضافية حيث كانت GPT-4 ببساطة تستنتج الحل منطقيًا.
أي أنه بشكل رسمي قد تكون الأخطاء أقل، لكن الاستنتاجات غالباً ما تكون غير مرضية، لأنها سطحية. لتفادي الأخطاء، يتحدث الذكاء الاصطناعي بحذر شديد وباختصار. بالإضافة إلى ذلك، فإن المشاكل المتعلقة بالسياق - نسيان التفاصيل، وإعادة السؤال - تضرب أيضاً في إدراك الدقة.
انخفاض الإبداع
أصبح GPT-5 أقل إبداعًا. إنه غالبًا ما يقدم حقائق مباشرة وصيغ بسيطة، بينما كان GPT-4 قادرًا على إبهار الأفكار غير التقليدية. القصص، الروايات، ألعاب الأدوار - في هذه المجالات، يُفضل GPT-4.
شارك أحد المؤلفين أنه استخدم الإصدار الرابع لسرد قصة مغامرات تفاعلية، وأن 4o حافظ على الحبكة والشخصيات بشكل ممتاز على مدار عشرات الرسائل. بينما GPT-5 في سيناريو مشابه "ينسى أو يخلط التفاصيل بسرعة، مما تم تقديمه قبل رسالتين فقط"، مما يؤدي إلى تدهور جودة القصة.
برمجة
البرمجة هي واحدة من المزايا الرئيسية لـ GPT-5. في العرض التقديمي، كتبت النموذج 700 سطر من الشيفرة في دقيقتين وأصدرت تطبيقًا جاهزًا.
الفرص حقًا مذهلة. GPT-5 في التكامل مع Codex CLI يفهم بدقة نوايا المبرمج وحتى "يفعل أكثر مما طُلب، دون إضافة المزيد"، كتب أحد المستخدمين على Reddit.
يلاحظ آخرون زيادة طفيفة ولكن واضحة في دقة وموثوقية الكود مقارنةً مع GPT-4o: عدد أقل من الهلاوس في الحلول البرمجية وقواعد نحوية أكثر دقة قليلاً.
بينما كان GPT-4 ( وخاصة الإصدارات المبكرة) قد يخطئ في المهام المعقدة، فإن GPT-5 يحتفظ بالسياق بشكل أفضل في أجزاء طويلة من الكود ويقدم تصحيحات أكثر معنى.
GPT-5 غالبًا ما تكون مفضلة على GPT-4o: لأنها "تفهم" الكود والتعليقات بشكل أعمق وتقدم حلولًا أنيقة. هذا ملحوظ بشكل خاص في المشاريع الكبيرة: يمكن لـ LLM الجديدة الحفاظ على الترابط في سياقات هائلة (مئات الآلاف من الرموز) دون تدهور جودة الاستدلال. كانت هذه مهمة صعبة بالنسبة للسابقة.
GPT-5 أقل نسيانًا لاستيراد المكتبات الضرورية أو الخلط بين بناء الجملة بين اللغات. في تصحيح الأخطاء، النموذج أيضًا جيد: مستخدمو Plus يلاحظون أن GPT-5 يجد أخطاء منطقية بشكل أفضل في الشيفرة المكتوبة بالفعل ويقترح تصحيحات صحيحة بشكل متكرر، بينما كان GPT-4 أحيانًا "يخمن".
ظهرت تعليقات تفيد بأن GPT-5 يتنافس بجدارة مع Claude 4 في المهام البرمجية - في بعض الأحيان يكون الحل من OpenAI أفضل، وفي أحيان أخرى من Anthropic، ولكن بشكل عام المستوى قريب. بمعنى أنه لم يحدث تقدم كبير، لكن OpenAI لحق بالمنافسين.
الميزة المهمة في GPT-5 هي السياق الضخم للكود. في واجهة برمجة التطبيقات، يتم الإعلان عن ما يصل إلى 1 مليون رمز في نافذة السياق، وفي واجهة الدردشة - أقل، ولكن لا يزال أكثر من السابق. والأهم من ذلك - يمكن للنموذج الحفاظ على الجودة الدلالية على عمق كبير جدًا.
بالنسبة للمبرمجين، فهذا يعني أن GPT-5 قادر على فهم المشروع ككل - يمكن إعطاؤه ملفًا ضخمًا أو عدة مستندات ومناقشة كل شيء معًا، دون الخوف من أن "ينهار" الذكاء الاصطناعي بسبب الحجم.
ForkLog تحقق من إمكانيات البرمجة من خلال الموجه النصي. تمكن ChatGPT من تنفيذ المهمة بسرعة، ويجب التحقق من فعالية الأداة المقدمة.
! البيانات: ForkLog.## ** وضع التفكير القوي **
بعد إصلاح التوجيه، بدأ وضع التفكير يعمل بشكل طبيعي. عندما يكون هناك حاجة إلى تحليل مفصل أو تحليل متعدد الخطوات، تقوم النموذج بتفعيل الخوارزمية المتقدمة بنفسها.
يمكن لمستخدمي Plus اختيار وضع GPT-5 Thinking للحصول على أعلى جودة من الردود. في هذه الحالة، تُظهر الشبكة العصبية حقًا نتائج جيدة: فهي تتعامل مع المهام المعقدة والإبداعية.
إمكانات متعددة الوسائط
واحدة من الاختلافات المهمة في GPT-5 هي التكامل العميق لمختلف أنواع البيانات. إذا كانت GPT-4 محدودة في النسخة متعددة الوسائط (كان إصدار Vision قادرًا على رؤية الصور، وكانت الصوت وضعًا منفصلًا)، فإن GPT-5 تفهم النصوص والصور والكلام على الفور في إطار نموذج موحد.
تتمتع وضعية الصوت المحسنة في GPT-5 بقدرتها على توليد الكلام بشكل أكثر طبيعية، والعمل مع نماذج الصوت المخصصة، وتغيير النغمة/السرعة بناءً على طلب المستخدم.
على سبيل المثال، يمكنك أن تطلب "التحدث بشكل أبطأ وأكثر ليونة" - وسيتكيف الذكاء الاصطناعي. أكدت OpenAI أن محرك الصوت القياسي القديم سيتم إيقافه، ليحل محله أصوات جديدة وأكثر تقدمًا.
لمستخدمي Plus، أصبح متاحًا الآن التواصل "الحيوي" مع ChatGPT تقريبًا في الوقت الحقيقي، وهو ما نال إعجاب الكثيرين. ومع ذلك، من المهم التأكيد على أنه لم تُلاحظ مشاكل ملحوظة في التواصل حتى مع GPT-4.
لا تزال كلا النموذجين غير قادرين على مقاطعة أو "التدخل" في الحوار. إذا تم طرح سؤال على الشبكات العصبية أثناء وجودها بين عدة أشخاص يتحدثون مع بعضهم البعض بشكل مستقل، فلن تنتظر إجابة.
علاوة على ذلك، حسّنت GPT-5 العمل مع الصور: حيث تحلل البيانات البصرية بشكل أفضل، وتستطيع وصف الصور، والرسوم البيانية، وتقديم المساعدة بشأن لقطات الشاشة، وما إلى ذلك.
بشكل عام، يمكن اعتبار تعدد الوسائط واحدة من الميزات الرئيسية لـ GPT-5. هنا يظهر تقدم كبير، وليس مجرد تحسين للسرعة. يمكن لـ GPT-5 وصف صورة، وقراءة نص من صورة، وتحليل رسم بياني أو مخطط، وتوضيح ميم، ومساعدة في محتوى لقطة الشاشة بدقة أكبر.
الإخراج
GPT-5 — ليس ثورة، وليس AGI، ولكنه خطوة ملحوظة إلى الأمام. أصبحت النموذج أكثر ذكاءً من حيث عدد من المعايير، ولكنه فقد جزءاً من "الإنسانية". نقاط القوة هي الكفاءة، الدقة، التعددية الوسائط. نقاط الضعف هي الجفاف، القيود، الأخطاء في البداية.
تتطور الشبكة العصبية، ويتم تصحيح الأخطاء، لذلك سيكون GPT-5 بلا شك مساعدًا لا غنى عنه في كل يوم، كما كان سابقًا GPT-4o.
ومع ذلك، لم ينجح اختبار كوب ChatGPT.
بدلاً من المعجزة، حصل المستخدمون على تحسين متواضع نسبيًا. كان يجب أن يسمى GPT-5 بـ GPT-4.2 أو 4.5، عندها كان من الممكن أن تتحقق توقعات المجتمع.