Обчислювальна потужність стає новою бізнес-моделлю, гаряча хвиля "переплавки" великих моделей може згаснути
Нещодавно навчання великих моделей викликало запеклу конкуренцію за ресурси високопродуктивних обчислень. Деякі компанії навіть не шкодують грошей на купівлю графічних процесорів (GPU) від NVIDIA. Однак цей бум "варіння еліксирів" може бути лише тимчасовим явищем, і постачальники обчислювальної потужності повинні заздалегідь підготуватися до раціонального повернення ринку.
Відомо, що в даний час в країні вже є понад 100 великих моделей з обсягом до 10 мільярдів параметрів. Але висококласні GPU не вистачає, що призводить до високих витрат на обчислювальну потужність, що є однією з основних проблем, з якими стикається галузь. Ціна на GPU Nvidia A100 на деякий час зросла до 200-300 тисяч юанів, а місячна оренда одного сервера A100 також досягала 50-70 тисяч юанів. Попри це, висококласні GPU залишаються важкодоступними.
Стикаючись із такими труднощами, підприємства шукають різні способи реагування:
Використання даних вищої якості для підвищення ефективності навчання
Підвищення можливостей інфраструктури, забезпечення тривалої стабільної роботи великих кластерів GPU
Оптимізація розподілу ресурсів, підвищення використання GPU
Покращити архітектуру мережі, зменшити затримку навчання
Використання архітектури суперкомп'ютерів замість традиційної хмарної архітектури
Використання вітчизняних платформ GPU замість продуктів NVIDIA
Проте ці рішення мають досить високий технологічний бар'єр для загальних підприємств. Тому багато алгоритмічних команд обирають професійних постачальників обчислювальної потужності для підтримки навчання великих моделей.
Насправді, обчислювальна потужність вже стала новим типом сервісної моделі. Сервіс обчислювальної потужності реалізує єдине виведення гетерогенних обчислювальних потужностей за допомогою нових обчислювальних технологій та інтегрується з такими технологіями, як хмарні обчислення, великі дані, штучний інтелект тощо. Він не тільки включає обчислювальну потужність, але й охоплює упаковку ресурсів, таких як зберігання, мережа тощо, які доставляються користувачам у формі API.
У ланцюгу постачання обчислювальної потужності, підприємства верхнього рівня надають базові апаратні ресурси, підприємства середнього рівня відповідають за виробництво та розподіл обчислювальної потужності, а підприємства нижнього рівня є кінцевими користувачами. Такий поділ праці дозволяє користувачам зручніше отримувати необхідну обчислювальну потужність, не створюючи складну інфраструктуру.
Наразі, обчислювальна потужність за тарифом та річна/місячна підписка є основними моделями тарифікації послуг. У майбутньому галузь також буде просувати "інтеграцію обчислень і мережі", досягнувши гнучкого розподілу через різні архітектури, регіони та постачальників послуг.
Дані Міністерства промисловості та інформаційних технологій Китаю свідчать, що у 2022 році загальний обсяг обчислювальної потужності Китаю досяг 180 EFLOPS, зайнявши друге місце у світі, а обсяг індустрії обчислювальної потужності сягнув 1,8 трильйона юанів. Поява великих моделей ще більше прискорила розвиток індустрії обчислювальної потужності.
Однак, експерти вважають, що нинішня "гонитва за чіпами" може бути лише тимчасовим явищем. У довгостроковій перспективі проблема нестачі Обчислювальної потужності зрештою буде вирішена. Команди, які займаються довготривалими дослідженнями, не будуть сліпо скуповувати, а терпляче чекатимуть, поки ринок повернеться до раціональності.
Для постачальників обчислювальної потужності першочерговим завданням є підготовка до змін, що настануть після охолодження ринку. Зі зменшенням ажіотажу навколо великих моделей, цей новий комерційний формат обчислювальної потужності очікує більш раціонального та стійкого розвитку.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Обчислювальна потужність послуг стає новою бізнес-можливістю. Гарячий тренінг великих моделей може стати раціональнішим.
Обчислювальна потужність стає новою бізнес-моделлю, гаряча хвиля "переплавки" великих моделей може згаснути
Нещодавно навчання великих моделей викликало запеклу конкуренцію за ресурси високопродуктивних обчислень. Деякі компанії навіть не шкодують грошей на купівлю графічних процесорів (GPU) від NVIDIA. Однак цей бум "варіння еліксирів" може бути лише тимчасовим явищем, і постачальники обчислювальної потужності повинні заздалегідь підготуватися до раціонального повернення ринку.
Відомо, що в даний час в країні вже є понад 100 великих моделей з обсягом до 10 мільярдів параметрів. Але висококласні GPU не вистачає, що призводить до високих витрат на обчислювальну потужність, що є однією з основних проблем, з якими стикається галузь. Ціна на GPU Nvidia A100 на деякий час зросла до 200-300 тисяч юанів, а місячна оренда одного сервера A100 також досягала 50-70 тисяч юанів. Попри це, висококласні GPU залишаються важкодоступними.
Стикаючись із такими труднощами, підприємства шукають різні способи реагування:
Проте ці рішення мають досить високий технологічний бар'єр для загальних підприємств. Тому багато алгоритмічних команд обирають професійних постачальників обчислювальної потужності для підтримки навчання великих моделей.
Насправді, обчислювальна потужність вже стала новим типом сервісної моделі. Сервіс обчислювальної потужності реалізує єдине виведення гетерогенних обчислювальних потужностей за допомогою нових обчислювальних технологій та інтегрується з такими технологіями, як хмарні обчислення, великі дані, штучний інтелект тощо. Він не тільки включає обчислювальну потужність, але й охоплює упаковку ресурсів, таких як зберігання, мережа тощо, які доставляються користувачам у формі API.
У ланцюгу постачання обчислювальної потужності, підприємства верхнього рівня надають базові апаратні ресурси, підприємства середнього рівня відповідають за виробництво та розподіл обчислювальної потужності, а підприємства нижнього рівня є кінцевими користувачами. Такий поділ праці дозволяє користувачам зручніше отримувати необхідну обчислювальну потужність, не створюючи складну інфраструктуру.
Наразі, обчислювальна потужність за тарифом та річна/місячна підписка є основними моделями тарифікації послуг. У майбутньому галузь також буде просувати "інтеграцію обчислень і мережі", досягнувши гнучкого розподілу через різні архітектури, регіони та постачальників послуг.
Дані Міністерства промисловості та інформаційних технологій Китаю свідчать, що у 2022 році загальний обсяг обчислювальної потужності Китаю досяг 180 EFLOPS, зайнявши друге місце у світі, а обсяг індустрії обчислювальної потужності сягнув 1,8 трильйона юанів. Поява великих моделей ще більше прискорила розвиток індустрії обчислювальної потужності.
Однак, експерти вважають, що нинішня "гонитва за чіпами" може бути лише тимчасовим явищем. У довгостроковій перспективі проблема нестачі Обчислювальної потужності зрештою буде вирішена. Команди, які займаються довготривалими дослідженнями, не будуть сліпо скуповувати, а терпляче чекатимуть, поки ринок повернеться до раціональності.
Для постачальників обчислювальної потужності першочерговим завданням є підготовка до змін, що настануть після охолодження ринку. Зі зменшенням ажіотажу навколо великих моделей, цей новий комерційний формат обчислювальної потужності очікує більш раціонального та стійкого розвитку.