تقدم هذه الشركة سرعة استنتاج LLM سريعة لدرجة أنها تدخن، حيث يمكن أن تصل إلى 1500 رمز/ثانية على الأقل!



ما هو المفهوم؟ في مزود نموذج qwen3 coder الخاص بـ openrouter، فإن الإنتاجية كما هو موضح في الشكل أدناه، فإن متوسط إنتاجية cerebras هو 1650tok/s، وهو 17 مرة من المرتبة الثانية 92tok/s.

وفقًا لهذه السعة ، يمكن أن تنتج عدة آلاف من الأسطر من التعليمات البرمجية في بضع ثوانٍ في مجال الترميز!

تتمثل القوة التنافسية الأساسية لهذه الشركة في تقنية الرقائق التي طورتها بنفسها، الصورة أدناه 2 هي مقارنة بين سرعة استدلال رقائقهم وسرعة GPU التقليدية 👇
شاهد النسخة الأصلية
post-image
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت