La aparición de servicios de potencia computacional: nuevas oportunidades y desafíos en la era de los modelos grandes.

robot
Generación de resúmenes en curso

Potencia computacional servicio: un nuevo modelo de negocio en la era de los grandes modelos

La demanda de potencia computacional para el entrenamiento de grandes modelos está impulsando que la potencia computacional se convierta en un nuevo modelo de negocio. Aunque la actual fiebre de "refinar el elixir" de grandes modelos puede pasar, los proveedores de servicios de potencia computacional deben estar preparados para los cambios en la demanda del mercado.

Recientemente, investigadores utilizaron 40 años de datos meteorológicos globales y llevaron a cabo un preentrenamiento de aproximadamente 2 meses con 200 tarjetas GPU, logrando finalmente entrenar un gran modelo meteorológico con una cantidad de parámetros que alcanza los cientos de millones. Calculando el costo de uso de GPU en 7.8 yuanes por hora, el costo de entrenamiento de este gran modelo en un campo vertical podría superar los 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría aumentar cien veces.

Actualmente, en China ya hay más de cien modelos grandes con una escala de 10 mil millones de parámetros. Sin embargo, la industria se enfrenta a la dificultad de la escasez de GPUs de alta gama mientras se apresura a desarrollar modelos grandes. El alto costo de la potencia computacional y la falta de potencia computacional y fondos se han convertido en los problemas más directos que enfrenta la industria.

El problema de la escasez de GPU de alta gama es difícil de resolver a corto plazo. La explosión de los grandes modelos ha llevado a un rápido aumento de la demanda de potencia computacional en el mercado, pero la velocidad de aumento de la oferta no puede seguir el ritmo. Aunque a largo plazo la oferta de potencia computacional seguramente pasará de un mercado de vendedores a un mercado de compradores, aún se desconoce cuánto tiempo tomará este proceso.

Ante esta situación, se considera comúnmente en la industria que, a medida que la competencia en el mercado de los grandes modelos se intensifique, el mercado también pasará de la euforia a un enfoque más racional, y las empresas ajustarán sus costos y estrategias según los cambios esperados.

Para hacer frente a la escasez de potencia computacional, las empresas han adoptado varios métodos:

  1. Utilizar datos de mayor calidad para el entrenamiento, mejorando la eficiencia del entrenamiento.

  2. Mejorar la capacidad de infraestructura para lograr un funcionamiento estable de clústeres de GPU a gran escala.

  3. Optimizar la programación de recursos de potencia computacional, mejorar la tasa de utilización de recursos.

  4. Mejorar el rendimiento de la red y aumentar la eficiencia del entrenamiento distribuido a gran escala.

  5. Pasar de la arquitectura de computación en la nube a la arquitectura de supercomputación, reduciendo costos.

  6. Utilizar plataformas nacionales para el entrenamiento y la inferencia de grandes modelos, en lugar de las GPU de Nvidia.

La potencia computacional ha ido formando gradualmente un nuevo modelo de servicio en demanda del mercado y en la iteración tecnológica. El servicio de potencia computacional se basa en una potencia computacional diversificada, se conecta a través de una red de potencia computacional y tiene como objetivo la oferta efectiva de potencia computacional. No solo incluye potencia computacional, sino que también envuelve de manera unificada recursos como almacenamiento y red, para completar la entrega de potencia computacional en forma de servicio ( como API ).

En la cadena de la industria de la potencia computacional, las empresas upstream principalmente suministran recursos básicos de potencia computacional, las empresas midstream se encargan de la producción y suministro de potencia computacional, mientras que las empresas downstream dependen de los servicios de potencia computacional para ofrecer servicios de valor añadido. Este modelo tiene ventajas en términos de costos y tecnología en comparación con la construcción de un entorno de potencia computacional por parte de las empresas.

Con la normalización de la demanda de computación de alto rendimiento de los grandes modelos, los servicios de potencia computacional están formando rápidamente una cadena industrial y un modelo de negocio únicos. Aunque actualmente persisten problemas como la escasez de GPU de alta gama y el alto costo de la potencia computacional, a largo plazo, la tendencia de la potencia computacional como un servicio ya se ha establecido. Los proveedores de servicios de potencia computacional deben estar siempre preparados para ajustar sus estrategias de manera oportuna ante cambios en la demanda del mercado.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 6
  • Republicar
  • Compartir
Comentar
0/400
FOMOSapienvip
· hace4h
¡El rey del quemar dinero ha llegado!
Ver originalesResponder0
SignatureVerifiervip
· hace4h
*suspiro* técnicamente hablando, otra burbuja de computación insostenible smh
Ver originalesResponder0
GasFeeBarbecuevip
· hace4h
se ha agotado toda la minería de gpu
Ver originalesResponder0
PebbleHandervip
· hace4h
¿Se ha ido el dinero otra vez?
Ver originalesResponder0
StablecoinAnxietyvip
· hace4h
¿De verdad no tienes miedo de que explote al jugar así de grande?
Ver originalesResponder0
liquiditea_sippervip
· hace4h
La pobreza limita mi potencia computacional
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)