شريك بانتيرا: عصر بوتات الذكاء الاصطناعي المدفوع بالتشفير

ستعمل تقنيات التشفير على تعزيز تطوير صناعة الروبوتات من خلال توفير ضمانات اقتصادية لأمان الروبوتات، وتحسين بنيتها التحتية للتواصل، ووقت الإستجابة، وعمليات جمع البيانات.

كتابة: بول فيراديتاكي، شريك في بانtera كابيتال

ترجمة: xiaozou، المالية الذهبية

ملخص:

تدفع الابتكارات وتأثيرات الحجم في VLA إلى ظهور الروبوتات البشرية الفعالة والموفرة والتي يمكن استخدامها بشكل عام.

مع توسع بوتات التخزين إلى سوق بوتات المستهلك، فإن أمان البوتات وآليات التمويل والتقييم تستحق استكشافًا عميقًا.

التشفير سيوفر ضمانات اقتصادية لحماية البوتات، ويعمل على تحسين البنية التحتية للتواصل، وقت الإستجابة وعمليات جمع البيانات، مما يعزز نمو صناعة البوتات.

غيرت ChatGPT بالكامل توقعات البشرية حول الذكاء الاصطناعي. عندما بدأت نماذج اللغة الكبيرة بالتفاعل مع العالم الخارجي من البرمجيات، اعتقد الكثيرون أن كيان الذكاء الاصطناعي هو الشكل النهائي. ولكن إذا نظرنا إلى أفلام الخيال العلمي الكلاسيكية مثل "حرب النجوم"، و"بليد رانر"، و"روبocop"، سنجد أن الحلم الحقيقي للبشر هو أن يتمكن الذكاء الاصطناعي من تحقيق التفاعل مع العالم الفيزيائي في شكل روبوتات.

في رأي بانtera كابيتال، فإن "لحظة ChatGPT" في مجال الروبوتات على وشك الحدوث. سنقوم أولاً بتحليل كيف غيرت الاختراقات في الذكاء الاصطناعي على مدار السنوات القليلة الماضية مشهد الصناعة، ثم نستكشف كيف ستشكل تقنيات البطاريات، ووقت الإستجابة، وتحسين جمع البيانات الصورة المستقبلية، بالإضافة إلى دور التشفير في ذلك. أخيرًا، سنوضح لماذا نعتقد أن أمان الروبوتات، والتمويل، والتقييم، والتعليم هي المجالات الرأسية التي تحتاج إلى التركيز عليها.

1، عناصر التغيير

(1)اختراق الذكاء الاصطناعي

تقدم مجالات نماذج اللغة الكبيرة متعددة الوسائط يمنح البوتات "العقل" اللازم لأداء المهام المعقدة. تدرك البوتات البيئة بشكل رئيسي من خلال حاستي البصر والسمع.

رغم أن نماذج الرؤية الحاسوبية التقليدية (مثل الشبكات العصبية التلافيفية) تتقن مهام الكشف عن الأشياء أو تصنيفها، إلا أنها تواجه صعوبة في تحويل المعلومات البصرية إلى تعليمات عمل هادفة. بينما تتفوق نماذج اللغة الكبيرة في فهم النصوص وتوليدها، إلا أنها محدودة في قدرتها على إدراك العالم الفيزيائي.

!

من خلال نموذج الرؤية - اللغة - العمل (VLA)، تتمكن بوتات من دمج الإدراك البصري وفهم اللغة والقيام بالعمل الفعلي ضمن إطار حسابي موحد. في فبراير 2025، أصدرت Figure AI نموذج التحكم في الروبوتات البشرية الشامل Helix، والذي يعتبر نموذج VLA هذا بمثابة معيار جديد في الصناعة بفضل قدراته على التعميم بدون عينة وهيكل النظام 1/ النظام 2. تتيح خاصية التعميم بدون عينة للروبوتات التكيف الفوري مع مشاهد جديدة وأشياء جديدة وتعليمات جديدة دون الحاجة إلى تدريب متكرر لكل مهمة. يفصل هيكل النظام 1/ النظام 2 بين الاستدلال العالي المستوى والاستدلال الخفيف الوزن، مما يحقق روبوتات بشرية تجارية تجمع بين التفكير الشبيه بالإنسان والدقة الفورية.

(2) أصبح الروبوتات الاقتصادية واقعاً

تتميز التقنيات التي تغير العالم بصفة مشتركة واحدة - القابلية للتعميم. لقد تم تعميم الهواتف الذكية وأجهزة الكمبيوتر الشخصية وتقنية الطباعة ثلاثية الأبعاد من خلال أسعار يمكن أن يتحملها الطبقة الوسطى. عندما تنخفض أسعار روبوتات مثل Unitree G1 عن سعر سيارة هوندا أكورد أو الحد الأدنى من الدخل السنوي في الولايات المتحدة البالغ 34,000 دولار، يصبح من غير المستغرب تخيل عالم تتولى فيه الروبوتات الأعمال البدنية والمهام اليومية.

!

(3) من التخزين إلى سوق المستهلكين

تكنولوجيا البوتات تتوسع من حلول التخزين إلى مجال المستهلك. هذا العالم مصمم للبشر - يمكن للبشر إكمال جميع أعمال البوتات المتخصصة، بينما لا تستطيع البوتات المتخصصة أداء جميع أعمال البشر. لم تعد شركات البوتات تقتصر على تصنيع بوتات مخصصة للمصانع، بل بدأت في تطوير بوتات بشرية أكثر عمومية. لذلك، فإن جبهة تكنولوجيا البوتات لا توجد فقط في المستودعات، بل ستتخلل الحياة اليومية.

التكلفة هي واحدة من العقبات الرئيسية للقابلية للتوسع. المؤشر الأكثر أهمية بالنسبة لنا هو التكلفة الإجمالية لكل ساعة، والتي يتم حسابها من خلال: تكلفة الفرصة البديلة لوقت التدريب والشحن، وتكلفة تنفيذ المهام، بالإضافة إلى تكلفة شراء البوتات، مقسومًا على إجمالي وقت تشغيل البوتات. يجب أن تكون هذه التكلفة أقل من متوسط الأجور في الصناعة ذات الصلة لتكون تنافسية.

!

يجب أن يكون التكلفة الشاملة للروبوتات في مجال التخزين أقل من 31.39 دولار في الساعة لتحقيق التغلغل الكامل. وفي أكبر سوق للاستهلاك، وهو مجال التعليم الخاص وخدمات الصحة، يجب أن يتم التحكم في هذه التكلفة لتكون أقل من 35.18 دولار. الروبوتات تتجه حاليا نحو أن تكون أقل تكلفة، وأكثر كفاءة، وأكثر عمومية.

2، الخطوة التالية في تقدم التشفير للروبوتات

(1)تحسين البطارية

تقنية البطاريات لا تزال تمثل عائقًا أمام الروبوتات الصديقة للمستخدم. السيارات الكهربائية المبكرة مثل BMW i3 واجهت صعوبات في الانتشار بسبب قيود تقنية البطاريات التي أدت إلى مدى قصير، وتكاليف عالية، وانخفاض في الجدوى. الروبوتات تواجه نفس المشكلة. الروبوت Spot من Boston Dynamics لديه مدى تشغيل لمرة واحدة يبلغ 90 دقيقة، بينما بطارية Unitree G1 تدوم حوالي ساعتين. من الواضح أن المستخدمين لا يرغبون في شحن البطارية يدويًا كل ساعتين، لذا أصبح الشحن الذاتي والبنية التحتية للتوصيل محورًا رئيسيًا للتطوير. حاليًا، هناك نوعان رئيسيان من أنظمة شحن الروبوتات: استبدال البطارية أو الشحن المباشر.

نمط استبدال البطارية يحقق العمل المستمر من خلال استبدال سريع لمجموعة البطاريات المستهلكة، مما يقلل من وقت التوقف إلى الحد الأدنى، وهو مناسب لمواقع العمل في الهواء الطلق أو المصانع. يمكن تنفيذ هذه العملية يدوياً أو بشكل آلي.

تستخدم الشحن بالتحريض طريقة الطاقة اللاسلكية، على الرغم من أن الشحن الكامل يستغرق وقتًا طويلاً، إلا أنه يمكن تحقيق عملية أوتوماتيكية بالكامل بسهولة.

(2)وقت الإستجابة تحسين

يمكن تصنيف عمليات التأخير المنخفض إلى فئتين: الإدراك البيئي والتحكم عن بُعد. يشير الإدراك إلى قدرة البوتات على إدراك البيئة من الناحية المكانية، بينما يشير التحكم عن بُعد تحديدًا إلى التحكم الفوري من قبل المشغل البشري.

وفقًا لدراسة Cintrini، بدأ نظام استشعار الروبوتات بأجهزة استشعار رخيصة، لكن الحاجز التكنولوجي يكمن في دمج البرمجيات، والحوسبة منخفضة الطاقة، والدورات الدقيقة في المللي ثانية. بعد أن يكمل الروبوت تحديد الموقع المكاني، ستقوم الشبكات العصبية خفيفة الوزن بتمييز العقبات، واللوحات، أو العناصر البشرية. بعد إدخال مسميات المشهد في نظام التخطيط، يتم على الفور توليد تعليمات المحرك المرسلة إلى القدم، أو مجموعة العجلات، أو الذراع الآلية. تأخير الاستشعار أقل من 50 مللي ثانية يعادل سرعة رد الفعل البشرية - أي تأخير يتجاوز هذه العتبة سيؤدي إلى حركات غير سلسة للروبوت. لذلك، يجب إتمام 90% من القرارات محليًا عبر شبكة بصرية - لغوية - حركية واحدة.

يجب على البوتات ذاتية التحكم ضمان أن يكون وقت الإستجابة لنموذج VLA أقل من 50 مللي ثانية؛ بينما يتطلب البوتات التي يتم التحكم فيها عن بُعد ألا يتجاوز وقت الإستجابة بين الطرف الذي يتحكم في البوتات والبوتات 50 مللي ثانية. هنا تبرز أهمية نموذج VLA بشكل خاص - إذا تم معالجة المدخلات البصرية والنصية بواسطة نماذج مختلفة ثم إدخالها في نموذج اللغة الكبير، فإن وقت الإستجابة الإجمالي سيتجاوز عتبة 50 مللي ثانية.

(3) تحسين جمع البيانات

توجد ثلاث طرق رئيسية لجمع البيانات: بيانات الفيديو من العالم الحقيقي، البيانات الاصطناعية وبيانات التحكم عن بُعد. تكمن العقبة الأساسية بين بيانات العالم الحقيقي والبيانات الاصطناعية في سد الفجوة بين سلوك الروبوتات الفيزيائي والنماذج الفيديو / المحاكاة. تفتقر بيانات الفيديو من العالم الحقيقي إلى تفاصيل فيزيائية مثل ردود الفعل اللمسية، أخطاء حركة المفاصل وتشوه المواد؛ بينما تفتقر البيانات الاصطناعية إلى متغيرات غير قابلة للتنبؤ مثل أعطال المستشعرات ومعامل الاحتكاك.

أكثر طرق جمع البيانات واعدة هي التحكم عن بعد - حيث يقوم المشغل البشري بالتحكم عن بعد في البوتات لأداء المهام. لكن تكلفة العمالة هي العامل الرئيسي المحدد لجمع البيانات عن طريق التحكم عن بعد.

تطوير الأجهزة المخصصة يوفر أيضًا حلولًا جديدة لجمع البيانات عالية الجودة. تجمع شركة Mecka بين الأساليب الشائعة والأجهزة المخصصة لجمع بيانات الحركة البشرية متعددة الأبعاد، والتي يتم تحويلها بعد المعالجة إلى مجموعات بيانات مناسبة لتدريب الشبكات العصبية للروبوتات، بالتعاون مع دورات التكرار السريعة لتوفير كميات هائلة من البيانات عالية الجودة لتدريب الروبوتات الذكية. تعمل هذه الأنابيب التقنية معًا على تقصير المسار من البيانات الخام إلى الروبوتات القابلة للنشر.

3، مجالات الاستكشاف الرئيسية

(1)التشفير بوتات

يمكن أن تحفز التشفير الأطراف غير الموثوقة على تحسين كفاءة شبكة البوتات. بناءً على المجالات الأساسية المذكورة أعلاه، نعتقد أن التشفير يمكن أن يعزز الكفاءة في ثلاثة مجالات: بنية التحتية للتوصيل، وقت الإستجابة، وجمع البيانات.

من المتوقع أن تُحدث شبكة البنية التحتية الفيزيائية اللامركزية (DePIN) ثورة في بنية الشحن. عندما تعمل الروبوتات البشرية في جميع أنحاء العالم مثل السيارات، يجب أن تكون محطات الشحن في متناول اليد مثل محطات الوقود. تتطلب الشبكة المركزية استثمارًا أوليًا ضخمًا، بينما تُوزع DePIN التكاليف على مشغلي العقد، مما يتيح توسيع مرافق الشحن بسرعة إلى المزيد من المناطق.

يمكن لـ DePIN أيضًا استخدام البنية التحتية الموزعة لتحسين وقت الإستجابة للتحكم عن بُعد. من خلال تجميع موارد الحوسبة من العقد الطرفية الموزعة جغرافيًا، يمكن معالجة أوامر التحكم عن بُعد بواسطة العقد المحلية أو الأقرب المتاحة، مما يقلل من مسافة نقل البيانات إلى الحد الأدنى، ويقلل بشكل كبير من وقت الإستجابة للاتصالات. لكن المشاريع الحالية لـ DePIN تركز بشكل أساسي على التخزين اللامركزي، وتوزيع المحتوى، ومشاركة النطاق الترددي، ورغم وجود مشاريع تُظهر مزايا الحوسبة الحافة في البث المباشر أو إنترنت الأشياء، إلا أنها لم تمتد بعد إلى مجال بوتات أو التحكم عن بُعد.

التحكم عن بُعد هو الطريقة الأكثر وعدًا لجمع البيانات، لكن تكلفة توظيف الكيانات المركزية لمتخصصين لجمع البيانات مرتفعة للغاية. يقوم DePIN بتحفيز الأطراف الثالثة من خلال التشفير لتوفير بيانات التحكم عن بُعد لحل هذه المشكلة. يقوم مشروع Reborn ببناء شبكة عالمية لمشغلي التحكم عن بُعد، وتحويل مساهماتهم إلى أصول رقمية موثقة، مما يشكل نظامًا لامركزيًا غير مُصرح به - حيث يمكن للمشاركين كسب الأرباح والمشاركة في الحوكمة والمساعدة في تدريب بوتات AGI.

(2) الأمن دائماً هو الشاغل الرئيسي

الهدف النهائي لتكنولوجيا الروبوتات هو تحقيق الاستقلالية الكاملة، ولكن كما حذرت سلسلة أفلام "المُنهِي"، فإن أكثر ما لا يرغب فيه البشر هو أن تؤدي الاستقلالية إلى تحويل الروبوتات إلى أسلحة عدوانية. لقد أثارت مشاكل أمان نماذج اللغة الكبيرة اهتمامًا، وعندما تمتلك هذه النماذج القدرة على الحركة المادية، يصبح أمان الروبوتات شرطًا أساسيًا لقبول المجتمع.

الأمان الاقتصادي هو أحد أعمدة ازدهار نظام بوتات البيئي. تقوم شركة OpenMind في هذا المجال ببناء FABRIC - طبقة تنسيق الآلات اللامركزية، التي تحقق مصادقة هوية الأجهزة والتحقق من الوجود الفعلي والوصول إلى الموارد من خلال التشفير. على عكس إدارة سوق المهام البسيطة، يمكّن FABRIC بوتات من إثبات معلومات الهوية والموقع الجغرافي وسجلات السلوك بشكل مستقل دون الاعتماد على وسطاء مركزيين.

يتم تنفيذ القيود السلوكية والمصادقة على الهوية من خلال آلية على السلسلة، مما يضمن إمكانية تدقيق الامتثال من قبل أي شخص. ستحصل بوتات التي تتوافق مع معايير الأمان ومتطلبات الجودة والمعايير الإقليمية على مكافآت، في حين سيواجه المخالفون عقوبات أو إلغاء مؤهلاتهم، مما يؤسس لآلية المساءلة والثقة في شبكة الآلات الذاتية.

يمكن لشبكات إعادة الرهن من طرف ثالث (مثل Symbiotic) أيضًا تقديم ضمانات أمان متساوية. على الرغم من أن نظام معلمات العقوبات لا يزال بحاجة إلى تحسين، فقد دخلت التكنولوجيا ذات الصلة مرحلة الاستخدام. نتوقع أن يتم تشكيل معايير أمان الصناعة قريبًا، وعندها سيتم نمذجة معلمات العقوبات بناءً على هذه المعايير.

مثال على خطة التنفيذ:

  • بوتات الشركة تنضم إلى شبكة Symbiotic.
  • تعيين معايير مصادرة قابلة للتحقق (مثل "تطبيق قوة تلامس بشرية تزيد عن 2500 نيوتن")؛
  • يقدم المراهنون ضمانات لضمان التزام البوتات بالمعايير؛
  • في حال حدوث انتهاك، سيتم استخدام الوديعة كتعويض للضحايا.

تعمل هذه النموذج على تحفيز الشركات لوضع الأمان في المقدمة، وفي الوقت نفسه تعزز من قبول المستهلكين من خلال آلية تأمين بركة الأموال المرهونة.

رؤية فريق Symbiotic في مجال البوتات هي:

إطار الإيداع العام Symbiotic يهدف إلى توسيع مفهوم الإيداع ليشمل جميع المجالات التي تحتاج إلى تأييد اقتصادي للأمان، سواء من خلال نموذج مشترك أو مستقل. تتراوح سيناريوهات تطبيقه من التأمين إلى التشفير، ويجب تصميم كل حالة على حدة. على سبيل المثال، يمكن بناء شبكة بوتات بالكامل استنادًا إلى إطار Symbiotic، مما يمكّن الأطراف المعنية من تقديم ضمانات اقتصادية لسلامة الشبكة.

4، سد الفجوات في تقنية بوتات

دفعت OpenAI إلى انتشار الذكاء الاصطناعي، لكن حجر الزاوية لـ ChatGPT قد تم تأسيسه منذ فترة طويلة. كسرت خدمات السحابة اعتماد النماذج على قوة الحوسبة المحلية، وحققت Huggingface مفتاح المصدر للنماذج، بينما وفرت Kaggle منصة تجريبية لمهندسي الذكاء الاصطناعي. هذه الاختراقات التدريجية ساهمت جميعها في تعميم الذكاء الاصطناعي.

على عكس الذكاء الاصطناعي، يصعب الدخول في مجال البوتات عندما تكون الأموال محدودة. لتحقيق انتشار البوتات، يجب أن ينخفض مستوى تطويرها إلى درجة سهولة تطوير تطبيقات الذكاء الاصطناعي. نعتقد أن هناك مجالاً للتحسين في ثلاثة مجالات: آلية التمويل، نظام التقييم، والنظام التعليمي.

تمويل هو نقطة الألم في مجال البوتات. يتطلب تطوير برنامج كمبيوتر جهاز كمبيوتر واحد وموارد الحوسبة السحابية، بينما يتطلب بناء بوت كامل الوظائف شراء المحركات، والمستشعرات، والبطاريات، وما إلى ذلك من الأجهزة، مما يجعل التكلفة تتجاوز بسهولة 100000 دولار. هذه الخصائص المتعلقة بالأجهزة تجعل تطوير البوتات أقل مرونة وأكثر تكلفة مقارنة بالذكاء الاصطناعي.

تظل بنية تقييم بوتات السيناريوهات الواقعية في مرحلة النشوء. لقد أُقيم نظام واضح لدوال الخسارة في مجال الذكاء الاصطناعي، حيث يمكن اختبارها بشكل كامل في بيئة افتراضية. لكن الاستراتيجيات الافتراضية الممتازة لا يمكن تحويلها مباشرة إلى حلول فعالة في العالم الحقيقي. يحتاج الروبوت إلى مرافق تقييم استراتيجياته الذاتية في بيئات واقعية متنوعة من أجل تحقيق تحسينات تكرارية.

عندما تنضج هذه البنية التحتية، سيتدفق عدد كبير من المواهب، وستعيد الروبوتات البشرية رسم منحنى انفجار Web2. تقدم شركة التشفير الروبوتية OpenMind في هذا الاتجاه - حيث يقوم مشروعها مفتوح المصدر OM1 ("نظام أندرويد للروبوتات") بتحويل الأجهزة الأصلية إلى وكالات ذكية قابلة للتطوير تتمتع بالوعي الاقتصادي. يمكن أن تكون وحدات الرؤية واللغة وتخطيط الحركة قابلة للتوصيل والتشغيل مثل تطبيقات الهاتف المحمول، حيث تعرض جميع خطوات الاستدلال باللغة الإنجليزية المبسطة، مما يسمح للمشغلين بتدقيق أو ضبط السلوك دون الحاجة إلى التفاعل مع البرنامج الثابت. تتيح هذه القدرة على الاستدلال باللغة الطبيعية للجيل الجديد من المواهب دخول مجال الروبوتات بسلاسة، مما يمثل خطوة حاسمة نحو إطلاق منصة مفتوحة ثورية للروبوتات، تمامًا كما كان للحركة مفتوحة المصدر تأثير تسريع على الذكاء الاصطناعي.

!

كثافة المواهب تحدد مسار الصناعة. نظام التعليم الشامل المنظم ضروري لتوصيل المواهب في مجال بوتات. إن إدراج OpenMind في ناسداك يرمز إلى بداية عصر جديد حيث تشارك الآلات الذكية في الابتكار المالي والتعليم الواقعي. أعلنت OpenMind بالتعاون مع Robostore أنها ستطلق أول منهج تعليمي عالمي قائم على بوتات Unitree G1 في المدارس العامة K-12 في الولايات المتحدة. تم تصميم هذا المنهج ليكون غير مرتبط بأي منصة، مما يجعله قابلاً للتكيف مع أشكال البوتات المختلفة، ويوفر للطلاب فرصًا للتطبيق العملي. تعزز هذه الإشارة الإيجابية حكمنا: في السنوات المقبلة، ستتساوى وفرة موارد التعليم المتعلقة بالبوتات مع تلك في مجال التشفير.

5، آفاق المستقبل

الابتكار وتأثيرات وفورات الحجم لنموذج العمل البصري - اللغوي - الحركي (VLA) قد أوجدت روبوتات بشرية فعالة واقتصادية وعامة. مع توسع الروبوتات التخزينية إلى السوق الاستهلاكية، أصبحت الأمان ونماذج التمويل ونظم التقييم اتجاهات استكشاف رئيسية. نحن نؤمن بشدة أن التشفير سيساهم في تقدم الروبوتات من خلال ثلاث مسارات: توفير ضمانات اقتصادية للأمان، تحسين البنية التحتية للشحن، وتعزيز أداء وقت الإستجابة وقنوات جمع البيانات.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت