Poder de computação como nova oportunidade de negócios O calor do treinamento de grandes modelos pode se tornar mais racional

robot
Geração do resumo em andamento

Poder de computação torna-se um novo modelo de negócio A "fusão" de grandes modelos pode estar a perder força

Recentemente, o treinamento de grandes modelos gerou uma intensa competição por recursos de computação de alto desempenho. Algumas empresas estão até dispostas a pagar altos preços para adquirir chips GPU da Nvidia. No entanto, essa "febre de alquimia" pode ser apenas um fenômeno temporário; os prestadores de serviços de poder de computação precisam se preparar para um retorno à racionalidade do mercado.

Sabe-se que atualmente existem mais de 100 grandes modelos com 10 bilhões de parâmetros no país. No entanto, a demanda por GPUs de alto desempenho supera a oferta, levando a altos custos de poder de computação, que se tornaram um dos principais desafios enfrentados pela indústria. O preço da GPU A100 da Nvidia foi inflacionado para 200.000 a 300.000 RMB, e o aluguel mensal de um servidor A100 chega a 50.000 a 70.000 RMB. Mesmo assim, as GPUs de alto desempenho ainda são difíceis de obter.

Diante dessa situação, as empresas estão buscando várias estratégias de resposta:

  1. Utilizar dados de maior qualidade para aumentar a eficiência do treinamento
  2. Melhorar a capacidade da infraestrutura, alcançando a operação estável a longo prazo de grandes clusters de GPU.
  3. Otimizar a alocação de recursos, aumentar a utilização da GPU
  4. Melhorar a arquitetura da rede, reduzir a latência de treinamento
  5. Adotar uma arquitetura de supercomputação em vez de uma arquitetura de nuvem tradicional
  6. Usar plataformas de GPU nacionais em vez de produtos da Nvidia

No entanto, essas soluções têm um alto nível técnico para empresas comuns. Assim, muitas equipes de algoritmos optam por prestadores de serviços de poder de computação especializados para apoiar o treinamento de grandes modelos.

Na verdade, o Poder de computação já se desenvolveu para um novo modelo de serviço. O serviço de Poder de computação alcança a saída unificada de Poder de computação heterogêneo através de novas tecnologias de computação, e se integra com tecnologias como computação em nuvem, big data e IA. Isso não inclui apenas o Poder de computação, mas também abrange a embalagem de recursos como armazenamento e rede, entregues aos usuários na forma de APIs.

Na cadeia de valor do poder de computação, as empresas upstream fornecem recursos de hardware básicos, as empresas midstream são responsáveis pela produção e agendamento do poder de computação, e as empresas downstream são os usuários finais. Essa divisão de trabalho permite que os usuários obtenham o poder de computação necessário de forma mais conveniente, sem a necessidade de construir uma infraestrutura complexa.

Atualmente, a faturação por consumo e a faturação anual/mensal são os modelos de faturação de serviços de poder de computação mais comuns. No futuro, a indústria também irá promover a "integração de computação e rede", permitindo a programação flexível entre diferentes arquiteturas, regiões e provedores de serviços.

Os dados do Ministério da Indústria e Tecnologia da Informação da China mostram que, em 2022, a escala total de poder de computação da China alcançou 180 EFLOPS, ocupando o segundo lugar a nível global, e a escala da indústria de poder de computação já atingiu 1,8 trilhões de yuans. O surgimento de grandes modelos acelerou ainda mais o desenvolvimento da indústria de poder de computação.

No entanto, profissionais do setor acreditam que a atual "corrida por chips" pode ser apenas um fenômeno temporário. A longo prazo, o problema da escassez de poder de computação será resolvido. As equipes que realmente se dedicam a pesquisas de longo prazo não irão comprar de forma impulsiva, mas sim esperar pacientemente que o mercado retorne à racionalidade.

Para os prestadores de serviços de poder de computação, a prioridade é estar preparado para as mudanças que ocorrerão após o esfriamento do mercado. Com a onda dos grandes modelos gradualmente a dissipar-se, este novo modelo de negócios de serviços de poder de computação irá enfrentar um desenvolvimento mais racional e sustentável.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • 2
  • Repostar
  • Compartilhar
Comentário
0/400
AirdropHustlervip
· 2h atrás
Outra boa oportunidade de fazer as pessoas de parvas
Ver originalResponder0
SadMoneyMeowvip
· 2h atrás
Estou tão pobre que não consigo alugar uma GPU.
Ver originalResponder0
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)