La ascensión de la potencia computacional: nuevos modelos de negocio y desafíos en la era de los grandes modelos

robot
Generación de resúmenes en curso

Potencia computacional servicios: un nuevo modelo de negocio en la era de los grandes modelos

Con el auge de los grandes modelos de inteligencia artificial, la potencia computacional se ha convertido en un nuevo modelo de negocio emergente. A pesar de que la actual tendencia de "refinar el elixir" de los grandes modelos puede ir disminuyendo gradualmente, los proveedores de servicios de potencia computacional aún necesitan prepararse para el futuro y ajustar oportunamente su dirección estratégica.

Recientemente, un joven que se graduó de la Universidad de Tsinghua hace 3 años ha entrenado un gran modelo meteorológico con una cantidad de parámetros que alcanza el nivel de cientos de millones. Este modelo utilizó datos meteorológicos de 40 años a nivel global, tardó aproximadamente 2 meses y utilizó 200 tarjetas GPU para el preentrenamiento. Calculando el costo de alquiler de GPU a 7.8 yuanes por hora, solo el costo de entrenamiento de este gran modelo en un campo vertical podría superar los 2 millones de yuanes. Si se tratara de entrenar un gran modelo general, el costo podría ser cien veces mayor.

Actualmente, en China ya hay más de 100 modelos de gran escala con 10 mil millones de parámetros. Sin embargo, la industria enfrenta en general la escasez de GPUs de alta gama y el alto costo de la potencia computacional. La falta de potencia computacional y financiamiento se ha convertido en el desafío más directo que enfrentan muchas empresas.

La escasez de GPU de alta gama se ha convertido en un problema reconocido en la industria. En el pico, el precio de una sola tarjeta NVIDIA A100 se disparó a 200,000-300,000 yuanes, y el alquiler mensual de un servidor A100 también aumentó a 50,000-70,000 yuanes. Aun así, puede que no se logre obtener los chips. Algunos proveedores de potencia computacional incluso se han encontrado con situaciones raras como incumplimientos por parte de los proveedores.

Al mismo tiempo, la barrera para el entrenamiento de grandes modelos no es tan fácil de superar como se promociona en la industria. Entrenar un modelo general de gran tamaño con mil millones de parámetros o más puede requerir una inversión de decenas de miles de millones. Sin un sólido apoyo financiero, es difícil llevar a cabo la investigación y desarrollo de grandes modelos de manera continua.

Ante esta situación, en la industria se considera generalmente que, a medida que el mercado se vuelve más racional, las empresas también ajustarán sus estrategias y controlarán costos. Algunas compañías están explorando métodos innovadores para compensar la falta de potencia computacional, como utilizar datos de mayor calidad para mejorar la eficiencia del entrenamiento, aumentar la estabilidad de la infraestructura, optimizar la programación de recursos, entre otros. También hay empresas que eligen usar plataformas nacionales en lugar de GPUs de Nvidia para el entrenamiento y la inferencia de modelos grandes.

La potencia computacional ha evolucionado en un nuevo modelo de servicio en función de la demanda del mercado y la iteración tecnológica. El servicio de potencia computacional se basa en una potencia computacional diversificada y, a través de la conexión de redes de potencia computacional, proporciona un suministro efectivo de potencia computacional. No solo incluye potencia computacional, sino que también integra recursos como almacenamiento y redes, completando la entrega de potencia computacional en forma de API, entre otros.

En la cadena de la industria de la potencia computacional, las empresas upstream proporcionan recursos básicos de potencia computacional, las empresas midstream son responsables de la producción y suministro de potencia computacional, y las empresas downstream dependen de los servicios de potencia computacional para el desarrollo de servicios de valor añadido. Con la normalización de la demanda de computación de alto rendimiento por parte de los grandes modelos, los servicios de potencia computacional están formando rápidamente una cadena de industria y un modelo comercial únicos.

Actualmente, la facturación por uso y los planes anuales y mensuales son los modelos de facturación de potencia computacional más comunes. La industria también está promoviendo la "integración y fusión de computación y red", apoyando la programación de recursos de potencia computacional a través de arquitecturas, regiones y proveedores de servicios.

A pesar de la actual escasez de GPU de alta gama y los altos costos, esto es solo un fenómeno temporal. A largo plazo, la Potencia computacional como servicio es una tendencia determinista. Los proveedores de servicios de Potencia computacional necesitan prepararse con anticipación y ajustar su dirección estratégica a tiempo cuando el mercado regrese a la racionalidad.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
CoinBasedThinkingvip
· hace14h
La especulación ha llegado hasta la potencia computacional.
Ver originalesResponder0
TestnetNomadvip
· hace14h
¿El servicio de potencia computacional de hígado puede ganar dinero?
Ver originalesResponder0
Web3ProductManagervip
· hace14h
haciendo algunos cálculos rápidos de ROI... los costos de computación van a matar a la mayoría de las startups, para ser sincero
Ver originalesResponder0
DEXRobinHoodvip
· hace14h
Los ricos también están compitiendo con todas sus fuerzas.
Ver originalesResponder0
GateUser-a606bf0cvip
· hace14h
Billetera preparada, listo para Todo dentro
Ver originalesResponder0
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)