Potencia computacional servicios se convierten en nuevas oportunidades de negocio, el entrenamiento de modelos grandes puede volverse más racional.

robot
Generación de resúmenes en curso

Potencia computacional se convierte en un nuevo modelo de negocio La fiebre de "refinar el elixir" de los grandes modelos podría desvanecerse

Recientemente, el entrenamiento de modelos grandes ha provocado una intensa competencia por recursos de computación de alto rendimiento. Algunas empresas incluso están dispuestas a pagar altos precios por las GPU de Nvidia. Sin embargo, esta "fiebre de alquimia" podría ser solo un fenómeno temporal, y los proveedores de potencia computacional deben prepararse para un regreso a la racionalidad del mercado.

Según se informa, en la actualidad hay más de 100 modelos a gran escala con 10 mil millones de parámetros en el país. Sin embargo, la demanda de GPU de alta gama supera la oferta, lo que provoca que los costos de potencia computacional sean elevados, convirtiéndose en uno de los principales desafíos que enfrenta la industria. El precio de la GPU A100 de Nvidia llegó a ser especulado hasta 200,000-300,000 yuanes, y el alquiler mensual de un servidor A100 también alcanzó entre 50,000 y 70,000 yuanes. A pesar de esto, sigue siendo difícil conseguir GPUs de alta gama.

Frente a esta situación, las empresas están buscando diversas estrategias de respuesta:

  1. Utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento
  2. Mejorar la capacidad de infraestructura para lograr un funcionamiento estable a largo plazo de clústeres de GPU a gran escala
  3. Optimizar la programación de recursos, aumentar la potencia computacional de la GPU.
  4. Mejorar la arquitectura de la red, reducir la latencia de entrenamiento
  5. Adoptar una arquitectura de supercomputación en lugar de una arquitectura de nube tradicional
  6. Usar plataformas de GPU nacionales en lugar de productos de NVIDIA

Sin embargo, estas soluciones tienen un alto umbral técnico para las empresas en general. Por lo tanto, muchos equipos de algoritmos eligen proveedores de servicios de potencia computacional especializados para apoyar el entrenamiento de grandes modelos.

De hecho, la potencia computacional se ha convertido en un nuevo modelo de servicio. El servicio de potencia computacional logra la salida unificada de potencia computacional heterogénea a través de nuevas tecnologías de cálculo, y se fusiona con tecnologías como la computación en la nube, big data e IA. No solo incluye potencia computacional, sino que también abarca el empaquetado de recursos como almacenamiento y red, que se entregan a los usuarios en formas como API.

En la cadena industrial de potencia computacional, las empresas upstream proporcionan recursos de hardware básico, las empresas midstream son responsables de la producción y programación de potencia computacional, y las empresas downstream son los usuarios finales. Esta división del trabajo permite a los usuarios obtener la potencia computacional que necesitan de manera más conveniente, sin la necesidad de construir infraestructuras complejas por sí mismos.

Actualmente, la facturación por uso y la facturación anual y mensual son los modelos de facturación de servicios de potencia computacional más comunes. En el futuro, la industria también promoverá la "integración de computación y red", logrando una programación flexible a través de arquitecturas, regiones y proveedores de servicios.

Según los datos del Ministerio de Industria y Tecnología de la Información, en 2022, la potencia computacional total de China alcanzó los 180 EFLOPS, ocupando el segundo lugar a nivel mundial, y la escala de la industria de la potencia computacional ha llegado a 1.8 billones de yuanes. El auge de los grandes modelos ha acelerado aún más el desarrollo de la industria de la potencia computacional.

Sin embargo, los expertos de la industria creen que la actual "caza de chips" podría ser solo un fenómeno temporal. A largo plazo, el problema de la Potencia computacional escasa finalmente se resolverá. Los equipos que realmente se dedican a la investigación a largo plazo no comprarán ciegamente, sino que esperarán pacientemente a que el mercado regrese a la racionalidad.

Para los proveedores de potencia computacional, la prioridad inmediata es prepararse para los cambios que vendrán después de que el mercado se enfríe. A medida que la emoción por los grandes modelos se desvanece gradualmente, este nuevo modelo de negocio de servicios de potencia computacional experimentará un desarrollo más racional y sostenible.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 2
  • Republicar
  • Compartir
Comentar
0/400
AirdropHustlervip
· hace6h
Otra buena oportunidad para tomar a la gente por tonta
Ver originalesResponder0
SadMoneyMeowvip
· hace6h
Estoy tan arruinado que no puedo alquilar una GPU.
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)