Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Çinli girişim, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolarlık eğittiğini iddia ediyor, sadece 2048 GPU kullanıyor ve rakipleri önemli ölçüde azaltıyor. Ancak bu görünüşte düşük maliyet, çok daha önemli bir yatırıma inanıyor.
%İmgp%resim: ensigame.com
Deepseek V3'ün yenilikçi mimarisi verimliliğine katkıda bulunur. Anahtar teknolojiler arasında eşzamanlı kelime tahmini için çoklu atak tahmini (MTP), hızlandırılmış eğitim için 256 sinir ağı kullanan uzmanların (MOE) karışımı ve iyileştirilmiş bilgi ekstraksiyonu için çok kafalı gizli dikkat (MLA) bulunmaktadır.
%İmgp%resim: ensigame.com
Bununla birlikte, bir yarı yarışma raporu çok daha büyük bir altyapı ortaya koymaktadır: yaklaşık 50.000 NVIDIA GPU'si yaklaşık 1.6 milyar dolara mal olur ve operasyonel giderler 944 milyon dolara yaklaşır. Bu, araştırma, iyileştirme, veri işleme ve genel altyapı hariç, yalnızca GPU'nun eğitim öncesi kullanımını yansıtan 6 milyon dolarlık eğitim maliyetiyle keskin bir tezat oluşturuyor.
Deepseek'in bağımsızlığı ve yüksek flyer hedge fonunun bir iştiraki olan verimli yapısı, başarısının anahtarıdır. Veri merkezlerine sahip olmak, optimize edilmiş model geliştirme ve hızlı inovasyona izin verir. Şirketin kendi kendini finanse etme ve yalın yapısı da çevikliğine katkıda bulunur. Bazı araştırmacılar için yıllık 1,3 milyon doları aşan yüksek maaşlar, Çin üniversitelerinden en iyi yetenekleri çekiyor.
%İmgp%resim: ensigame.com
Deepseek'in 6 milyon dolarlık iddiası yanıltıcı olsa da, 500 milyon doları aşan gerçek yatırımı hala rakiplere kıyasla önemli bir maliyet avantajını temsil ediyor. Şirketin R1 modelinin eğitilmesi 5 milyon dolara mal olurken, Chatgpt-4'ün 100 milyon dolara mal olduğu bildiriliyor. Deepseek'in başarısı, iyi finanse edilen, bağımsız bir AI şirketinin rekabet potansiyelini vurgulamaktadır, ancak "bütçe dostu" anlatı niteliğine ihtiyaç duyar.
%İmgp%resim: ensigame.com
Sonuç olarak, Deepseek'in rekabet avantajı, sadece oldukça düşük bir eğitim bütçesinden ziyade, önemli yatırım, teknolojik yenilik ve yüksek vasıflı bir ekip kombinasyonundan kaynaklanmaktadır. Bununla birlikte, düzeltilmiş rakamlarla bile, maliyetleri rakiplerinin maliyetlerinden önemli ölçüde daha düşüktür.