Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. La startup cinese afferma di aver formato la sua potente rete neurale DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU, sottovalutando significativamente i concorrenti. Questo costo apparentemente basso, tuttavia, smentisce un investimento molto più sostanziale.
Immagine: Ensigame.com
L'architettura innovativa di Deepseek V3 contribuisce alla sua efficienza. Le tecnologie chiave includono la previsione multi-token (MTP) per la previsione di parole simultanee, la miscela di esperti (MOE) che impiegano 256 reti neurali per la formazione accelerata e l'attenzione latente multi-testa (MLA) per una migliore estrazione informativa.
Immagine: Ensigame.com
Tuttavia, un rapporto di semianalisi rivela un'infrastruttura molto più grande: circa 50.000 GPU NVIDIA, che costano circa $ 1,6 miliardi, con spese operative che si avvicinano a $ 944 milioni. Ciò contrasta bruscamente con il costo di formazione pubblicizzato di $ 6 milioni, che riflette solo l'utilizzo della GPU pre-allenamento, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e l'infrastruttura complessiva.
L'indipendenza di Deepseek e la struttura efficiente, una consociata di hedge fund ad alto frigio, sono fondamentali per il suo successo. Possedere i suoi data center consente uno sviluppo del modello ottimizzato e una rapida innovazione. L'autofinanziamento e la struttura snella dell'azienda contribuiscono anche alla sua agilità. Gli alti salari, superiori a $ 1,3 milioni all'anno per alcuni ricercatori, attirano i migliori talenti dalle università cinesi.
Immagine: Ensigame.com
Mentre il reclamo di $ 6 milioni di Deepseek è fuorviante, il suo investimento effettivo superiore a $ 500 milioni rappresenta ancora un vantaggio di costo significativo rispetto ai concorrenti. Il modello R1 dell'azienda è costato $ 5 milioni per l'allenamento, mentre secondo quanto riferito CHATGPT-4 è costato $ 100 milioni. Il successo di Deepseek evidenzia il potenziale competitivo di un'azienda di intelligenza artificiale indipendente ben finanziata, sebbene la sua narrativa "economica".
Immagine: Ensigame.com
In conclusione, il vantaggio competitivo di Deepseek deriva da una combinazione di investimenti sostanziali, innovazione tecnologica e un team altamente qualificato, piuttosto che esclusivamente da un budget di formazione notevolmente basso. Tuttavia, anche con le cifre corrette, i suoi costi rimangono significativamente inferiori a quelli dei suoi concorrenti.