Welcome to 0516f.com ! Juegos Aplicaciones Noticias Temas Categoría
Hogar > Noticias > La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

La asequibilidad de Deepseek es un mito: la IA revolucionaria en realidad costó $ 1.6 mil millones para desarrollarse

Autor : Sebastian
Feb 27,2025

El modelo de IA sorprendentemente barato de Deepseek desafía a los gigantes de la industria. La startup china afirma haber capacitado a su poderosa red neuronal de Deepseek V3 por solo $ 6 millones, utilizando solo 2048 GPU, significativamente socavando competidores. Sin embargo, este costo aparentemente bajo desmiente una inversión mucho más sustancial.

DeepSeek TestImagen: Ensigame.com

La arquitectura innovadora de Deepseek V3 contribuye a su eficiencia. Las tecnologías clave incluyen predicción múltiple (MTP) para la predicción simultánea de palabras, la mezcla de expertos (MOE) que emplean 256 redes neuronales para la capacitación acelerada y atención latente de múltiples cabezas (MLA) para mejorar la extracción de información.

DeepSeek V3Imagen: Ensigame.com

Sin embargo, un informe de semianálisis revela una infraestructura mucho mayor: aproximadamente 50,000 GPU NVIDIA, que cuesta alrededor de $ 1.6 mil millones, con gastos operativos que se acercan a $ 944 millones. Esto contrasta fuertemente con el costo de capacitación publicitado de $ 6 millones, lo que solo refleja el uso de GPU previo al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura general.

La independencia y la estructura eficiente de Deepseek, una subsidiaria del fondo de cobertura de alto flyer, son clave para su éxito. Poseer sus centros de datos permite el desarrollo de modelos optimizado y la innovación rápida. La estructura de autofinanciación y la fondos de la compañía también contribuyen a su agilidad. Los altos salarios, superiores a $ 1.3 millones anuales para algunos investigadores, atraen a los mejores talentos de las universidades chinas.

DeepSeekImagen: Ensigame.com

Si bien el reclamo de $ 6 millones de Deepseek es engañoso, su inversión real superior a $ 500 millones todavía representa una ventaja de costo significativa en comparación con los competidores. El modelo R1 de la compañía costó $ 5 millones para entrenar, mientras que ChatGPT-4 se informa que costó $ 100 millones. El éxito de Deepseek destaca el potencial competitivo de una compañía de IA independiente bien financiada, aunque su calificación narrativa "económica".

DeepSeekImagen: Ensigame.com

En conclusión, la ventaja competitiva de Deepseek se deriva de una combinación de inversión sustancial, innovación tecnológica y un equipo altamente calificado, en lugar de solo de un presupuesto de capacitación notablemente bajo. Sin embargo, incluso con las cifras corregidas, sus costos siguen siendo significativamente más bajos que los de sus competidores.

Últimos artículos