दीपसेक की आश्चर्यजनक रूप से लागत प्रभावी एआई मॉडल चुनौतियां उद्योग के दिग्गजों को चुनौती देती हैं। शुरू में अपने शक्तिशाली दीपसेक वी 3 मॉडल के लिए केवल $ 6 मिलियन प्रशिक्षण लागत का दावा करते हुए, एक नज़दीकी नज़र से कहीं अधिक पर्याप्त निवेश का पता चलता है।
दीपसेक का वी 3 मॉडल अभिनव प्रौद्योगिकियों का दावा करता है: मल्टी-टोकन भविष्यवाणी (एमटीपी) , एक साथ कई शब्दों की भविष्यवाणी करना; विशेषज्ञों (एमओई) का मिश्रण , बढ़ाया प्रसंस्करण के लिए 256 तंत्रिका नेटवर्क का उपयोग करना; और मल्टी-हेड लेटेंट ध्यान (एमएलए) , बेहतर सटीकता के लिए प्रमुख वाक्य तत्वों पर ध्यान केंद्रित करना।
छवि: ensigame.com
हालांकि, सेमियालिसिस ने डीपसेक के पर्याप्त बुनियादी ढांचे को उजागर किया: लगभग 50,000 एनवीडिया हॉपर जीपीयू, जिसमें H800, H100 और H20 यूनिट शामिल हैं, कई डेटा केंद्रों में फैले हुए हैं। यह लगभग $ 1.6 बिलियन के कुल सर्वर निवेश का प्रतिनिधित्व करता है और $ 944 मिलियन के पास परिचालन लागत है।
छवि: ensigame.com
एक चीनी हेज फंड, हाई-फ्लायर की सहायक कंपनी दीपसेक अपने डेटा सेंटरों का मालिक है, नियंत्रण और तेजी से नवाचार को बढ़ावा देती है। इसकी स्व-वित्त पोषित प्रकृति चपलता और तेजी से निर्णय लेने में योगदान देती है। कंपनी शीर्ष प्रतिभा को आकर्षित करती है, कुछ शोधकर्ताओं ने मुख्य रूप से चीनी विश्वविद्यालयों से सालाना $ 1.3 मिलियन से अधिक कमाई की।
छवि: ensigame.com
प्रारंभिक $ 6 मिलियन का आंकड़ा केवल पूर्व-प्रशिक्षण GPU उपयोग, अनुसंधान, शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे को शामिल करता है। दीपसेक का वास्तविक एआई विकास निवेश $ 500 मिलियन से अधिक है। इसके बावजूद, इसकी दुबली संरचना बड़े, अधिक नौकरशाही प्रतियोगियों के विपरीत, कुशल नवाचार के लिए अनुमति देती है।
छवि: ensigame.com
जबकि दीपसेक की सफलता पर्याप्त निवेश, तकनीकी प्रगति और एक कुशल टीम से उपजी है, "बजट के अनुकूल" कथा भ्रामक है। फिर भी, इसकी लागत प्रतियोगियों की तुलना में काफी कम है; उदाहरण के लिए, Chatgpt4 के $ 100 मिलियन की तुलना में दीपसेक के R1 मॉडल की लागत $ 5 मिलियन है। दीपसेक का उदाहरण एक अच्छी तरह से वित्त पोषित स्वतंत्र एआई कंपनी को स्थापित नेताओं के साथ सफलतापूर्वक प्रतिस्पर्धा करता है, हालांकि प्रारंभिक लागत दावों को सावधानीपूर्वक व्याख्या की आवश्यकता होती है।