أطلقت OpenAI رسميًا الوكيل الذكاء الاصطناعي الأول "المشغل" الذي يمكنه التحكم الذاتي في تنفيذ مهام مختلفة على المتصفح، بما في ذلك حجز السفر، وطلب الطعام، وملء الاستمارات، ويدعم أيضًا معالجة المهام المتعددة والإعدادات الشخصية. يقتصر استخدام المشغل حاليًا على مستخدمي النسخة المهنية في الولايات المتحدة. (ملخص الموقف السابق: سيتم إطلاق ChatGPT o3-mini قريبًا! OpenAI يزيد منتجاته: الإطلاق في الربع الأول لأدوات وكلاء الذكاء الاصطناعي) (تكملة الخلفية: OpenAI، سوفت بن، أوراكل تطلقان أكبر مشروع للبنية التحتية للذكاء الاصطناعي في التاريخ "مشروع ستارجيت": استثمار 500 مليار دولار في بناء مراكز بيانات في الولايات المتحدة) وكيل الذكاء الاصطناعي (الوكيل) هو سباق مهم في صناعة الذكاء الاصطناعي والتشفير هذا العام. بعد ظهور نظام "استخدام الكمبيوتر" من Anthropic في نهاية أكتوبر الماضي: نظام يمكنه التعامل مع واجهة الكمبيوتر بنفس طريقة الإنسان، بدأ تطوير وكلاء الذكاء الاصطناعي في تخيلات أوسع نطاقًا. واليوم، أطلقت OpenAI أيضًا رسميًا وكيلها الذكاء الاصطناعي الأول "المشغل"، ليصبح موضوعًا رئيسيًا في مجتمع الذكاء الاصطناعي. وظيفة المشغل ونطاق استخدامه يُفترض أن المشغل هو وكيل ذكاء اصطناعي يمكنه التحكم الذاتي في المتصفح لتنفيذ مهام مختلفة للمستخدم. يكفي للمستخدم وصف المهمة التي يرغب في إنجازها، وسيقوم المشغل بالتعامل مع باقي العمل، مثل حجز السفر والمطاعم على Booking.com، وطلب المواد الغذائية والطعام من UBER، وملء الاستمارات، ومساعدتك في جمع قائمة التسوق، وإنشاء الذكريات... ويمكنه معالجة مهام متعددة في نفس الوقت (تمامًا مثل تصفحنا للعديد من الصفحات في المتصفح). بالإضافة إلى ذلك، يمكنه أيضًا تذكر تفضيلات وإعدادات المستخدم، وتقديم خدمة أكثر تخصيصًا؛ كما يمكن للمستخدم التدخل في العمليات في أي وقت، وضبط العمليات أو إنهائها. بالإضافة إلى سهولة الاستخدام، يولي المشغل اهتمامًا كبيرًا أيضًا لخصوصية وأمان المستخدم. يقول المسؤولون إن المستخدم يمكنه حذف جميع سجلات التصفح، وتسجيل الخروج من جميع المواقع بنقرة واحدة. وفي الوقت نفسه، تقدم OpenAI خيارات إعدادات الخصوصية، حيث يمكن للمستخدم اختيار إغلاق ميزة "تحسين النموذج" لتجنب استخدام بياناته في تدريب النموذج. المشغل حاليًا في مرحلة معاينة البحث، ومتاح فقط لمستخدمي النسخة المهنية في الولايات المتحدة (الاشتراك يكلف 200 دولار أمريكي شهريًا)، يمكن للمستخدم زيارة هذا الرابط Operator.ChatGPT.com. سيتم توسيعه في المستقبل ليشمل مستخدمي Plus وTeams وEnterprise. حصلت على وصول مبكر إلى ChatGPT Operator. إنه وكيل الذكاء الاصطناعي الجديد من OpenAI الذي يتخذ إجراءات بشكل آلي عبر الويب نيابة عنك. أفضل 9 حالات استخدام أدهشتني (فيديوهات مسرعة): 1. طلب مكونات العشاء استنادًا إلى صورة ووصفة pic.twitter.com/tdbApPELD4 - Rowan Cheung (@rowancheung) 23 يناير 2025 مبدأ العمل المشغل يعتمد على نموذج جديد يسمى "وكيل استخدام الكمبيوتر (CUA)". يجمع CUA بين قدرات معالجة GPT-4o للرؤية والاستدلال المتقدم الذي يأتي من التعلم المعزز، مدربًا خصيصًا للتفاعل مع واجهات المستخدم الرسومية (GUI)، مثل الأزرار والقوائم وحقول النص على الشاشة. من خلال اللقطة، يمكن للمشغل "رؤية" محتوى الواجهة، والتفاعل عن طريق استخدام الماوس ولوحة المفاتيح، وبالتالي تحقيق التفاعل بالصفحة الويب دون الحاجة إلى تكامل API. عند مواجهة تحديات أو أخطاء، سيستخدم المشغل قدرات الاستدلال لتصحيح نفسه؛ وإذا لم يتمكن من حل المشكلة، سيعيد السيطرة إلى المستخدم لضمان سلاسة العملية والتعاون مع المستخدم لإكمال المهمة. تقول OpenAI إنها قد أقامت شراكات مع بعض الشركاء، بما في ذلك DoorDash وInstacart وOpenTable وPriceline وStubHub وThumbtack وUber، لضمان أن المشغل يلبي المتطلبات الفعلية مع الالتزام بالمعايير المحددة. قيود المشغل ومع ذلك، يشارك رائد الأعمال Greg Isenberg بعض القيود التي تواجه المشغل. على سبيل المثال، لا يمكنه معالجة المهام المتعلقة بالدفع أو تسجيل الدخول، وقد يواجه صعوبة في الواجهات المعقدة، ولا يمكنه التعامل مع CAPTCHAs (التحقق). بالإضافة إلى ذلك، لا يزال موعد إطلاقه في أوروبا غير مؤكد، وفقًا لتصريح الرئيس التنفيذي لـ OpenAI سام ألتمان، فإنه لا يزال "بحاجة إلى وقت". في المستقبل، سيفتح المشغل واجهة برمجة التطبيقات لتوفير الدعم للمطورين، وفي الوقت نفسه، سيستمر في تعزيز الوظائف وتوسيع نطاق تغطية المستخدمين، وسيتم دمج هذه الوظيفة مباشرة في ChatGPT في المستقبل. تقارير ذات صلة أقوى نموذج من OpenAI o3 "يتعرض لاتهامات الغش"، هل استخدم امتيازات للحصول مسبقًا على إجابات الاختبارات، وتزوير القدرات الرياضية؟ ترغب في التحكم في ChatGPT؟ موسك يكتب إلى المدعي العام العام، يطالب بإجبار بيع حصص OpenAI OpenAI تطلق نموذج o3! تعزيز قدرات الاستدلال إلى مستوى أعلى، وتمهيد الطريق لجيل جديد من الذكاء الاصطناعي 〈أطلقت OpenAI وكيلها الذكاء الاصطناعي الأول "المشغل"! يمكنه مساعدتك في التسوق، وحجز التذاكر، وطلب الطعام... حل المهام الإلكترونية المعقدة〉 تم نشر هذه المقالة أولاً في BlockTempo، وهي أكثر وسائل الإعلام الأخبارية الرائدة في مجال البلوكتشين.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
صدر أول وكيل AI لـ OpenAI، "Operator"! قادر على مساعدتك في التسوق وحجز التذاكر وطلب الطعام ... حل المهام المعقدة عبر الإنترنت
أطلقت OpenAI رسميًا الوكيل الذكاء الاصطناعي الأول "المشغل" الذي يمكنه التحكم الذاتي في تنفيذ مهام مختلفة على المتصفح، بما في ذلك حجز السفر، وطلب الطعام، وملء الاستمارات، ويدعم أيضًا معالجة المهام المتعددة والإعدادات الشخصية. يقتصر استخدام المشغل حاليًا على مستخدمي النسخة المهنية في الولايات المتحدة. (ملخص الموقف السابق: سيتم إطلاق ChatGPT o3-mini قريبًا! OpenAI يزيد منتجاته: الإطلاق في الربع الأول لأدوات وكلاء الذكاء الاصطناعي) (تكملة الخلفية: OpenAI، سوفت بن، أوراكل تطلقان أكبر مشروع للبنية التحتية للذكاء الاصطناعي في التاريخ "مشروع ستارجيت": استثمار 500 مليار دولار في بناء مراكز بيانات في الولايات المتحدة) وكيل الذكاء الاصطناعي (الوكيل) هو سباق مهم في صناعة الذكاء الاصطناعي والتشفير هذا العام. بعد ظهور نظام "استخدام الكمبيوتر" من Anthropic في نهاية أكتوبر الماضي: نظام يمكنه التعامل مع واجهة الكمبيوتر بنفس طريقة الإنسان، بدأ تطوير وكلاء الذكاء الاصطناعي في تخيلات أوسع نطاقًا. واليوم، أطلقت OpenAI أيضًا رسميًا وكيلها الذكاء الاصطناعي الأول "المشغل"، ليصبح موضوعًا رئيسيًا في مجتمع الذكاء الاصطناعي. وظيفة المشغل ونطاق استخدامه يُفترض أن المشغل هو وكيل ذكاء اصطناعي يمكنه التحكم الذاتي في المتصفح لتنفيذ مهام مختلفة للمستخدم. يكفي للمستخدم وصف المهمة التي يرغب في إنجازها، وسيقوم المشغل بالتعامل مع باقي العمل، مثل حجز السفر والمطاعم على Booking.com، وطلب المواد الغذائية والطعام من UBER، وملء الاستمارات، ومساعدتك في جمع قائمة التسوق، وإنشاء الذكريات... ويمكنه معالجة مهام متعددة في نفس الوقت (تمامًا مثل تصفحنا للعديد من الصفحات في المتصفح). بالإضافة إلى ذلك، يمكنه أيضًا تذكر تفضيلات وإعدادات المستخدم، وتقديم خدمة أكثر تخصيصًا؛ كما يمكن للمستخدم التدخل في العمليات في أي وقت، وضبط العمليات أو إنهائها. بالإضافة إلى سهولة الاستخدام، يولي المشغل اهتمامًا كبيرًا أيضًا لخصوصية وأمان المستخدم. يقول المسؤولون إن المستخدم يمكنه حذف جميع سجلات التصفح، وتسجيل الخروج من جميع المواقع بنقرة واحدة. وفي الوقت نفسه، تقدم OpenAI خيارات إعدادات الخصوصية، حيث يمكن للمستخدم اختيار إغلاق ميزة "تحسين النموذج" لتجنب استخدام بياناته في تدريب النموذج. المشغل حاليًا في مرحلة معاينة البحث، ومتاح فقط لمستخدمي النسخة المهنية في الولايات المتحدة (الاشتراك يكلف 200 دولار أمريكي شهريًا)، يمكن للمستخدم زيارة هذا الرابط Operator.ChatGPT.com. سيتم توسيعه في المستقبل ليشمل مستخدمي Plus وTeams وEnterprise. حصلت على وصول مبكر إلى ChatGPT Operator. إنه وكيل الذكاء الاصطناعي الجديد من OpenAI الذي يتخذ إجراءات بشكل آلي عبر الويب نيابة عنك. أفضل 9 حالات استخدام أدهشتني (فيديوهات مسرعة): 1. طلب مكونات العشاء استنادًا إلى صورة ووصفة pic.twitter.com/tdbApPELD4 - Rowan Cheung (@rowancheung) 23 يناير 2025 مبدأ العمل المشغل يعتمد على نموذج جديد يسمى "وكيل استخدام الكمبيوتر (CUA)". يجمع CUA بين قدرات معالجة GPT-4o للرؤية والاستدلال المتقدم الذي يأتي من التعلم المعزز، مدربًا خصيصًا للتفاعل مع واجهات المستخدم الرسومية (GUI)، مثل الأزرار والقوائم وحقول النص على الشاشة. من خلال اللقطة، يمكن للمشغل "رؤية" محتوى الواجهة، والتفاعل عن طريق استخدام الماوس ولوحة المفاتيح، وبالتالي تحقيق التفاعل بالصفحة الويب دون الحاجة إلى تكامل API. عند مواجهة تحديات أو أخطاء، سيستخدم المشغل قدرات الاستدلال لتصحيح نفسه؛ وإذا لم يتمكن من حل المشكلة، سيعيد السيطرة إلى المستخدم لضمان سلاسة العملية والتعاون مع المستخدم لإكمال المهمة. تقول OpenAI إنها قد أقامت شراكات مع بعض الشركاء، بما في ذلك DoorDash وInstacart وOpenTable وPriceline وStubHub وThumbtack وUber، لضمان أن المشغل يلبي المتطلبات الفعلية مع الالتزام بالمعايير المحددة. قيود المشغل ومع ذلك، يشارك رائد الأعمال Greg Isenberg بعض القيود التي تواجه المشغل. على سبيل المثال، لا يمكنه معالجة المهام المتعلقة بالدفع أو تسجيل الدخول، وقد يواجه صعوبة في الواجهات المعقدة، ولا يمكنه التعامل مع CAPTCHAs (التحقق). بالإضافة إلى ذلك، لا يزال موعد إطلاقه في أوروبا غير مؤكد، وفقًا لتصريح الرئيس التنفيذي لـ OpenAI سام ألتمان، فإنه لا يزال "بحاجة إلى وقت". في المستقبل، سيفتح المشغل واجهة برمجة التطبيقات لتوفير الدعم للمطورين، وفي الوقت نفسه، سيستمر في تعزيز الوظائف وتوسيع نطاق تغطية المستخدمين، وسيتم دمج هذه الوظيفة مباشرة في ChatGPT في المستقبل. تقارير ذات صلة أقوى نموذج من OpenAI o3 "يتعرض لاتهامات الغش"، هل استخدم امتيازات للحصول مسبقًا على إجابات الاختبارات، وتزوير القدرات الرياضية؟ ترغب في التحكم في ChatGPT؟ موسك يكتب إلى المدعي العام العام، يطالب بإجبار بيع حصص OpenAI OpenAI تطلق نموذج o3! تعزيز قدرات الاستدلال إلى مستوى أعلى، وتمهيد الطريق لجيل جديد من الذكاء الاصطناعي 〈أطلقت OpenAI وكيلها الذكاء الاصطناعي الأول "المشغل"! يمكنه مساعدتك في التسوق، وحجز التذاكر، وطلب الطعام... حل المهام الإلكترونية المعقدة〉 تم نشر هذه المقالة أولاً في BlockTempo، وهي أكثر وسائل الإعلام الأخبارية الرائدة في مجال البلوكتشين.