OpenAI يفتح الباب أمام البحث العميق: يمكن للمستخدمين المدفوعين الاستعلام 10 مرات شهريًا، وتطلق Microsoft وكيل AI متعدد الأوضاع Magma

robot
إنشاء الملخص قيد التقدم

أعلنت OpenAI، مطور ChatGPT، في بداية الشهر الجاري عن إطلاق وظيفة وكيل AI الجديدة Deep Research لمستخدمي Pro، وفي 26 من الشهر أعلنت عن فتحها بشكل كامل لجميع مستخدمي الدفع. في الوقت نفسه، أعلنت Microsoft اليوم عن مفتوح المصدر موديل AI متعدد الوسائط Magma، الذي يمكنه معالجة البيانات متعددة الوسائط مثل النصوص والصور ومقاطع الفيديو. وفي الوقت الذي تركز فيه OpenAI ومنافسوه على تعزيز قدراتهم التقنية، فإنهم لا يقدمون فقط وظائف تعزيزية لتحسين أداء النماذج، بل يسرعون أيضًا في تعزيز مشاريع البلوكتشين في بعض المجالات. وقد أطلقت OpenAI في بداية الشهر الجديد وظيفة وكيل AI الجديدة Deep Research، وفتحتها لمستخدمي Pro للاستخدام، حيث يمكن لهذه الوظيفة تنفيذ أبحاث متعددة الخطوات عبر الإنترنت مصممة خصيصًا للمهام المعقدة، ويمكنها إنجاز عمليات يدوية كانت تستغرق ساعات في غضون دقائق قليلة. يمكن للمستخدمين تقديم تلميح واحد فقط، حيث يقوم ChatGPT بالبحث والتحليل والتجميع من مئات المصادر عبر الإنترنت لتوليد تقرير كامل بمستوى احترافي، تتميز هذه الوظيفة بالعمل على نسخة مخصصة من نموذج o3 الخاص بـ OpenAI، محسنة لتصفح الويب وتحليل البيانات، وتستخدم القدرة الاستدلالية للبحث والتفسير والتحليل للنصوص والصور وملفات PDF عبر الإنترنت بكميات كبيرة، ويمكنها تعديل اتجاه البحث بمرونة بناءً على المعلومات الجديدة. وقد قدمت OpenAI وظيفة Deep Research لمستخدمي Plus وغيرهم والآن في 26 من الشهر أعلنت عن فتح Deep Research بالكامل لمستخدمي ChatGPT Plus وTeam وEdu وEnterprise، تم تحسين وظيفة Deep Research بطرق مثل إمكانية تضمين الصور مع الاقتباسات في الإخراج وتحسين الفهم والإشارة إلى الملفات المرفوعة. منذ إطلاقها الأولي، قمنا ببعض التحسينات على البحث العميق: تضمين الصور مع الاقتباسات في الإخراج تحسين الفهم والإشارة إلى الملفات المرفوعة - OpenAI (@OpenAI) 25 فبراير 2025 سيتمكن مستخدمو Plus وTeam وEnterprise وEdu من استخدام وظيفة Deep Research 10 مرات شهريًا، أما مستخدمو Pro فسيتمكنون من استخدامها 120 مرة شهريًا. كما أصدرت OpenAI بطاقات نظامية تقدم شرحًا لتطوير وظيفة Deep Research وتقييم القدرات وتحسين الأمان، كما دعت الخبراء للمشاركة في تدريب النماذج المستقبلية. بالإضافة إلى ذلك، أعلنت Microsoft اليوم عن موديل AI متعدد الوسائط Magma مفتوح المصدر على موقعها الرسمي. يتميز Magma عن الوكلاء التقليديين بقدرته على التعامل مع البيانات متعددة الوسائط عبر العالم الرقمي والفيزيائي، حيث يمكنه معالجة الصور والفيديوهات والنصوص وأنواع بيانات أخرى مختلفة تلقائيًا. بالإضافة إلى ذلك، يحتوي Magma على وظيفة تنبؤية نفسية مدمجة، تعزز فهمه للتغيرات الزمنية والمكانية في المشاهد المستقبلية، مما يمكنه من تخمين حركات الأشخاص أو الأشياء في الفيديو ونواياهم المستقبلية بدقة. يمكن للمستخدمين استخدام Magma لتنفيذ مجموعة متنوعة من المهام التلقائية، مثل تسجيل الدخول للتسوق عبر الإنترنت أو الاستعلام عن الطقس، وحتى التحكم عن بعد في الروبوتات الحقيقية، وتقديم توجيهات لاتخاذ القرارات في اللعبة الحقيقية، لمساعدة المستخدمين في لعب الشطرنج بكفاءة أكبر. ووفقًا لمقدمة Microsoft الرسمية، يمكن لـ Magma مساعدة المساعدات أو الروبوتات المدعومة بالذكاء الاصطناعي على فهم البيئة المحيطة بها واتخاذ الإجراءات المناسبة، مثل تعليم الروبوتات المنزلية كيفية تنظيم العناصر التي لم تلامسها من قبل، أو مساعدة المساعد الافتراضي في إنشاء دليل تعليمات تفصيلية لمهام التشغيل الغير مألوفة. كنموذج أساسي VLA (رؤية - لغة - حركة)، يمكن لـ Magma التكيف مع تحديات جديدة في البيئات الرقمية والفيزيائية، حيث يتعلم الموديل من مجموعات بيانات الرؤية العامة واللغوية الكبيرة، ومن خلال دمج الفهم اللغوي والإدراك المكاني والقدرة على التفكير الزمني، يستطيع هذا الموديل التعامل مع مشاهد معقدة مختلفة سواء في العالم الافتراضي أو في البيئات الحقيقية، ويوفر قيمة تطبيقية ذكية قوية.

شاهد النسخة الأصلية
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت