نموذج OpenAI الأقوى o3 يشتبه في الغش بالاعتماد على الامتيازات للحصول مسبقًا على إجابات الاختبار، هل يتلاعب بقدرات الرياضيات؟

في الآونة الأخيرة ، نشر مقاول Epoch الذكاء الاصطناعي ، وهي منظمة غير ربحية تسمى "Meemi" ، على منتدى أقل خطأ أن OpenAI ، المطور وراء ChatGPT ، ممول من القطاع الخاص منصة اختبار الرياضيات الذكاء الاصطناعي FrontierMath ، وكان له شرف الحصول على أسئلة وأجوبة اختبار FrontierMath لمساعدة أحدث طراز o3 في الحصول على درجة عالية في الاختبار. (ملخص: هل تريد التحكم في ChatGPT؟ أرسل ماسك خطابا إلى المفتش العام يطالب فيه بمزاد إلزامي لأسهم OpenAI) (ملحق الخلفية: أصدرت OpenAI وظيفة Day2 الجديدة المتمثلة في "ضبط التعلم المعزز" مقابل السماء لتعزيز دقة التعلم الذكاء الاصطناعي المجالات المهنية) نشرت OpenAI ، المطور وراء ChatGPT ، مؤخرا شائعات عن احتيال النموذج ، مما تسبب في نقاش واسع النطاق في مجتمع التكنولوجيا. نشأ الحادث من كشف من قبل مقاول Epoch الذكاء الاصطناعي لمنظمة غير ربحية تدعى "Meemi" في منتدى أقل خطأ. يشير المقال إلى أن FrontierMath ، الرياضيات لاختبار الذكاء الاصطناعي التطوير ، لم يتم تمويل FrontierMath من قبل OpenAI فحسب ، بل تتمتع FrontierMath بامتياز "فتح باب خلفي" لأحدث طراز o3 من OpenAI. اقرأ المزيد: OpenAI تطلق نموذج o3! القدرة على التفكير تدفع المستوى ، مما يمهد الطريق للجيل القادم من الذكاء الاصطناعي تتهم ميمي OpenAI بالحصول على أسئلة وأجوبة قبل اختبار نماذج o3 ذكرت ميمي في المقال أن العديد من المقترحات والمقاولين ذوي الصلة ب FrontierMath لم يكونوا على دراية بتمويل OpenAI: لم يتم إبلاغ علماء الرياضيات الذين خلقوا مشاكل الرياضيات ل FrontierMath (بنشاط) بالتمويل من OpenAI. يطلب من المقاولين الحفاظ على سرية الموضوعات وإجاباتهم ، بما في ذلك عدم استخدام Overleaf أو Colab أو البريد الإلكتروني لمناقشة الموضوعات ، والتوقيع على اتفاقيات عدم الإفشاء (البروتوكول السري) لضمان سرية الموضوع وتجنب التسرب. بالإضافة إلى ذلك ، لم يتم إبلاغ المقاولين بتمويل OpenAI في 20 ديسمبر. أعتقد أنه حتى بعض مؤلفي الأوراق الموقعة غير مدركين لتمويل OpenAI. وأضاف ميمي أن لديه مصادر غير مباشرة تشير إلى أن OpenAI كان لديه أسئلة وأجوبة FrontierMath قبل الاختبار: حاليا ، لا يشير Epoch الذكاء الاصطناعي أو OpenAI علنا إلى ما إذا كان OpenAI سيكون قادرا على الوصول إلى هذه الأسئلة أو الإجابات أو الحلول. لدي مصادر غير مباشرة تشير إلى أن OpenAI يمتلك هذه الأسئلة والأجوبة ويستخدمها لاختبار التحقق من الصحة. ليس من الواضح بالنسبة لي ما إذا كان لدى Epoch الذكاء الاصطناعي و OpenAI قيود بروتوكول على استخدام مجموعة البيانات هذه للتدريب ، ولكن هناك بعض المؤشرات على عدم وجود مثل هذا البروتوكول. ما هو فرونتير ماث؟ من المفهوم أن FrontierMath هي رياضيات جديدة تم إطلاقها بشكل مشترك من قبل Epoch الذكاء الاصطناعي وأكثر من 60 عالم رياضيات حول العالم ، بما في ذلك الأساتذة والأشخاص الذين يقترحون المنظمة البحرية الدولية والفائزون بميدالية فيلدز. تشمل هذه المشكلات الرياضية ، التي تتراوح من صعوبة Orsay إلى حدود الرياضيات اليوم ، جميع الفروع الرئيسية للبحث الرياضي الحالي - من المشكلات المكثفة حسابيا في نظرية الأعداد وتحليل الأعداد الحقيقية إلى المشكلات المجردة في الهندسة الجبرية ونظرية الزمر. تقدم المؤسس المشارك ل Epoch الذكاء الاصطناعي للاعتذار في وقت الضجة في المجتمع ، قام المؤسس المشارك ل Epoch الذكاء الاصطناعي Tamay Besiroglu أيضا بتغريد اعتذار عن الأمر في 19 ، قائلا: لقد ارتكبنا خطأ ولم نكشف عن مشاركة OpenAI في FrontierMath في وقت سابق. يمنعنا عقدنا من الكشف حتى يتم إصدار طراز O3. بعد فوات الأوان ، كان ينبغي لنا أن نعمل بجد أكبر من أجل الشفافية في وقت مبكر. ونحن نعترف بذلك وسنفعل ما هو أفضل في المستقبل. أضاف Besiroglu أيضا على مدونته أنه في حين أن OpenAI لديه حق الوصول إلى FrontierMass ، إلا أنه يحتوي على "بروتوكول شفهي" بينه وبين Epoch الذكاء الاصطناعي لا يستخدم مجموعة مشكلات FrontierMax لتدريب نماذج الذكاء الاصطناعي. بالإضافة إلى ذلك ، يحتوي Epoch الذكاء الاصطناعي على مجموعة احتفاظ منفصلة كضمان إضافي للتحقق بشكل مستقل من نتائج اختبار FrontierMath Standard. لقد ارتكبنا خطأ بعدم الكشف عن مشاركة OpenAI في FrontierMath في وقت أقرب. عقدنا منعنا حتى حوالي o3. بعد فوات الأوان ، كان ينبغي لنا حقا أن نضغط من أجل الشفافية في وقت مبكر. نحن نملك هذا وسنفعل ما هو أفضل. - تاماي بيسيروغلو (@tamaybes) يناير 19، 2025 قصص ذات صلة آرثر هايز: لا أعتقد أن ترامب سيبني احتياطيات BTC ، ينخفض احتمال مرور Polymarket لمدة 100 يوم إلى 36٪ أبلغ ترامب عن البطاقة؟ Family التمويل اللامركزي Project WLFI Last Night زيادة المركزk مليون BTC, إثيريوم, AAVE, ONDO.. أخذت السلفادور القرض لمواصلة زيادة المركز 12 BTC، وليس إغراق مع صندوق النقد الدولي بروتوكول "OpenAI أقوى نموذج o3" انفجرت الغش "يشتبه في استخدام الامتيازات للحصول على إجابات الاختبار مقدما، والاحتيال القدرة الرياضية؟ تم نشر هذه المقالة لأول مرة في BlockTempo "الاتجاه الديناميكي - وسائل الإعلام الإخبارية الأكثر تأثيرا".

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت