تقدم هذه الشركة سرعة استنتاج LLM سريعة لدرجة أنها تدخن، حيث يمكن أن تصل إلى 1500 رمز/ثانية على الأقل!
ما هو المفهوم؟ في مزود نموذج qwen3 coder الخاص بـ openrouter، فإن الإنتاجية كما هو موضح في الشكل أدناه، فإن متوسط إنتاجية cerebras هو 1650tok/s، وهو 17 مرة من المرتبة الثانية 92tok/s.
وفقًا لهذه السعة ، يمكن أن تنتج عدة آلاف من الأسطر من التعليمات البرمجية في بضع ثوانٍ في مجال الترميز!
تتمثل القوة التنافسية الأساسية لهذه الشركة في تقنية الرقائق التي طورتها بنفسها، الصورة أدناه 2 هي مقارنة بين سرعة استدلال رقائقهم وسرعة GPU التقليدية 👇
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تقدم هذه الشركة سرعة استنتاج LLM سريعة لدرجة أنها تدخن، حيث يمكن أن تصل إلى 1500 رمز/ثانية على الأقل!
ما هو المفهوم؟ في مزود نموذج qwen3 coder الخاص بـ openrouter، فإن الإنتاجية كما هو موضح في الشكل أدناه، فإن متوسط إنتاجية cerebras هو 1650tok/s، وهو 17 مرة من المرتبة الثانية 92tok/s.
وفقًا لهذه السعة ، يمكن أن تنتج عدة آلاف من الأسطر من التعليمات البرمجية في بضع ثوانٍ في مجال الترميز!
تتمثل القوة التنافسية الأساسية لهذه الشركة في تقنية الرقائق التي طورتها بنفسها، الصورة أدناه 2 هي مقارنة بين سرعة استدلال رقائقهم وسرعة GPU التقليدية 👇