दीपसेक के आश्चर्यजनक रूप से सस्ते एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। चीनी स्टार्टअप का दावा है कि उसने अपने शक्तिशाली दीपसेक वी 3 न्यूरल नेटवर्क को केवल $ 6 मिलियन के लिए प्रशिक्षित किया है, केवल 2048 जीपीयू का उपयोग करते हुए, प्रतियोगियों को काफी कम कर दिया है। यह प्रतीत होता है कि कम लागत, हालांकि, एक अधिक पर्याप्त निवेश को मानता है।
छवि: ensigame.com
दीपसेक वी 3 की अभिनव वास्तुकला इसकी दक्षता में योगदान देती है। प्रमुख प्रौद्योगिकियों में एक साथ शब्द भविष्यवाणी के लिए मल्टी-टोकन भविष्यवाणी (एमटीपी), विशेषज्ञों का मिश्रण (एमओई) शामिल है जो त्वरित प्रशिक्षण के लिए 256 तंत्रिका नेटवर्क को नियोजित करता है, और बेहतर सूचना निष्कर्षण के लिए मल्टी-हेड लेटेंट ध्यान (एमएलए)।
छवि: ensigame.com
हालांकि, एक अर्ध -संबंधी रिपोर्ट में बहुत अधिक बुनियादी ढांचे का पता चलता है: लगभग 50,000 एनवीडिया जीपीयू, लगभग $ 1.6 बिलियन की लागत, $ 944 मिलियन के पास परिचालन खर्च के साथ। यह प्रचारित $ 6 मिलियन प्रशिक्षण लागत के साथ तेजी से विपरीत है, जो केवल अनुसंधान, शोधन, डेटा प्रसंस्करण और समग्र बुनियादी ढांचे को छोड़कर, पूर्व-प्रशिक्षण GPU उपयोग को दर्शाता है।
दीपसेक की स्वतंत्रता और कुशल संरचना, उच्च-फ्लाइर हेज फंड की सहायक कंपनी, इसकी सफलता के लिए महत्वपूर्ण हैं। इसके डेटा केंद्रों के मालिक होने से अनुकूलित मॉडल विकास और तेजी से नवाचार की अनुमति मिलती है। कंपनी की स्व-फंडिंग और दुबला संरचना भी इसकी चपलता में योगदान करती है। उच्च वेतन, कुछ शोधकर्ताओं के लिए सालाना $ 1.3 मिलियन से अधिक, चीनी विश्वविद्यालयों से शीर्ष प्रतिभा को आकर्षित करता है।
छवि: ensigame.com
जबकि दीपसेक का $ 6 मिलियन का दावा भ्रामक है, इसका वास्तविक निवेश $ 500 मिलियन से अधिक है, अभी भी प्रतियोगियों की तुलना में एक महत्वपूर्ण लागत लाभ का प्रतिनिधित्व करता है। कंपनी के R1 मॉडल की लागत $ 5 मिलियन को प्रशिक्षित करने के लिए है, जबकि CHATGPT-4 की कथित तौर पर $ 100 मिलियन का खर्च आता है। दीपसेक की सफलता एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी की प्रतिस्पर्धी क्षमता पर प्रकाश डालती है, हालांकि इसकी "बजट-अनुकूल" कथा को योग्यता की आवश्यकता है।
छवि: ensigame.com
अंत में, दीपसेक की प्रतिस्पर्धी बढ़त पर्याप्त निवेश, तकनीकी नवाचार और एक उच्च कुशल टीम के संयोजन से उपजी है, बजाय केवल एक उल्लेखनीय रूप से कम प्रशिक्षण बजट से। हालांकि, सही आंकड़ों के साथ भी, इसकी लागत इसके प्रतिद्वंद्वियों की तुलना में काफी कम है।