Ця компанія пропонує LLM, швидкість виводу якого така висока, що димить, і може досягати щонайменше 1500 токенів/секунду!
Яка концепція? На діаграмі, представленій постачальником моделі qwen3 coder від openrouter, середня пропускна здатність cerebras становить 1650tok/s, що в 17 разів більше, ніж у другого місця з 92tok/s.
Згідно з цією пропускною здатністю, у сфері кодування за кілька секунд можна видати тисячі рядків коду!
Основна конкурентоспроможність цієї компанії полягає в розробленій власноруч технології чіпів. На малюнку 2 представлено порівняння швидкості висновку їхніх чіпів та традиційних GPU👇
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Ця компанія пропонує LLM, швидкість виводу якого така висока, що димить, і може досягати щонайменше 1500 токенів/секунду!
Яка концепція? На діаграмі, представленій постачальником моделі qwen3 coder від openrouter, середня пропускна здатність cerebras становить 1650tok/s, що в 17 разів більше, ніж у другого місця з 92tok/s.
Згідно з цією пропускною здатністю, у сфері кодування за кілька секунд можна видати тисячі рядків коду!
Основна конкурентоспроможність цієї компанії полягає в розробленій власноруч технології чіпів. На малюнку 2 представлено порівняння швидкості висновку їхніх чіпів та традиційних GPU👇