Вычислительная мощность услуг становится новой бизнес-возможностью, горячее обучение больших моделей может стать более рациональным.

robot
Генерация тезисов в процессе

Вычислительная мощность становится новой бизнес-моделью: волна «варки эликсиров» больших моделей может ослабнуть

В последнее время обучение больших моделей вызвало жесткую конкуренцию за ресурсы высокопроизводительных вычислений. Некоторые компании даже не жалеют денег, чтобы купить GPU-чипы от NVIDIA. Однако этот бум "алхимии" может быть лишь временным явлением, и провайдерам вычислительных мощностей необходимо заранее подготовиться к рациональному возвращению рынка.

Согласно имеющейся информации, в настоящее время в стране уже есть более 100 крупных моделей с объемом до 1 миллиарда параметров. Однако высококлассные GPU не хватает, что приводит к высоким затратам на вычислительную мощность и становится одной из основных проблем, с которыми сталкивается отрасль. Цена на GPU Nvidia A100 в какой-то момент подскочила до 200-300 тысяч юаней, а месячная аренда одного сервера A100 достигала 50-70 тысяч юаней. Тем не менее, высококлассные GPU по-прежнему трудно достать.

Сталкиваясь с этой ситуацией, компании ищут различные способы реагирования:

  1. Используйте более качественные данные для повышения эффективности обучения
  2. Повышение возможностей инфраструктуры для обеспечения долгосрочной стабильной работы крупномасштабных кластеров GPU
  3. Оптимизация распределения ресурсов, повышение использования GPU
  4. Улучшение сетевой архитектуры, уменьшение задержки обучения
  5. Использование архитектуры суперкомпьютера вместо традиционной облачной архитектуры
  6. Использование отечественной платформы GPU вместо продуктов Nvidia

Однако для обычных предприятий эти решения имеют высокую техническую планку. Поэтому многие алгоритмические команды выбирают профессиональных поставщиков вычислительной мощности для поддержки обучения больших моделей.

На самом деле, вычислительная мощность уже превратилась в новый тип сервисной модели. Услуги вычислительной мощности достигают единого вывода гетерогенной вычислительной мощности с помощью новых вычислительных технологий и интегрируются с облачными вычислениями, большими данными, ИИ и другими технологиями. Это включает не только вычислительную мощность, но и упаковку таких ресурсов, как хранилище, сеть и т. д., которые предоставляются пользователям в форме API.

В вычислительной мощностной цепочке поставок, upstream-компании предоставляют базовые аппаратные ресурсы, midstream-компании отвечают за производство и распределение вычислительной мощности, а downstream-компании являются конечными пользователями. Такая специализация позволяет пользователям более удобно получать необходимую вычислительную мощность, не создавая сложную инфраструктуру самостоятельно.

В настоящее время основной моделью расчета за услуги вычислительной мощности являются поэтапная оплата и годовая/месячная подписка. В будущем в отрасли будет продвигаться "интеграция вычислительных сетей", что позволит осуществлять гибкое распределение ресурсов между различными архитектурами, регионами и поставщиками услуг.

Согласно данным Министерства промышленности и информации Китая, в 2022 году общая вычислительная мощность Китая достигла 180 EFLOPS, что заняло второе место в мире, а объем вычислительной отрасли составил 1,8 трлн юаней. Подъем крупных моделей еще больше ускорил развитие вычислительной отрасли.

Однако, эксперты считают, что нынешний бум "поиска чипов" может быть лишь временным явлением. В долгосрочной перспективе проблема нехватки вычислительной мощности в конечном итоге будет решена. Настоящие исследовательские команды, занимающиеся долгосрочными исследованиями, не будут слепо скупать, а будут терпеливо ждать, когда рынок вернется к разумности.

Для провайдеров вычислительной мощности первоочередной задачей является подготовка к изменениям после охлаждения рынка. С уменьшением популярности больших моделей, этот новый бизнес-модель обслуживания вычислительной мощности будет сталкиваться с более рациональным и устойчивым развитием.

Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 2
  • Репост
  • Поделиться
комментарий
0/400
AirdropHustlervip
· 6ч назад
Еще одна хорошая возможность разыграть людей как лохов
Посмотреть ОригиналОтветить0
SadMoneyMeowvip
· 6ч назад
Слишком бедный, чтобы арендовать GPU.
Посмотреть ОригиналОтветить0
  • Закрепить