दीपसेक के नए चैटबॉट ने एआई बाजार में एक महत्वपूर्ण प्रभाव डाला है, जो खुद को पेचीदा बयान के साथ पेश करता है:
नमस्ते, मैं बनाया गया था ताकि आप कुछ भी पूछ सकें और एक उत्तर प्राप्त कर सकें जो आपको आश्चर्यचकित भी कर सकता है।
यह AI मॉडल न केवल एक दुर्जेय प्रतियोगी बन गया है, बल्कि NVIDIA के सबसे बड़े स्टॉक प्राइस ड्रॉप्स में से एक में भी योगदान दिया है। एआई विकास के लिए दीपसेक का अभिनव दृष्टिकोण इसे अलग करता है, जैसे उन्नत प्रौद्योगिकियों का उपयोग करता है:
मल्टी-टोकन भविष्यवाणी (एमटीपी) : यह विधि मॉडल को एक साथ कई शब्दों की भविष्यवाणी करने की अनुमति देती है, जो विभिन्न वाक्य भागों का विश्लेषण करके, सटीकता और दक्षता दोनों को बढ़ाती है।
विशेषज्ञों का मिश्रण (MOE) : 256 तंत्रिका नेटवर्क को नियोजित करना, प्रत्येक टोकन प्रसंस्करण कार्य के लिए आठ सक्रिय होने के साथ, यह आर्किटेक्चर AI प्रशिक्षण को गति देता है और प्रदर्शन को बढ़ाता है।
मल्टी-हेड लेटेंट ध्यान (एमएलए) : एक वाक्य के सबसे महत्वपूर्ण हिस्सों पर ध्यान केंद्रित करके और प्रमुख विवरणों को बार-बार निकालने से, एमएलए महत्वपूर्ण जानकारी को लापता होने की संभावना को कम करता है, एआई को महत्वपूर्ण बारीकियों को पकड़ने में सक्षम बनाता है।
चित्र: ensigame.com
दीपसेक, एक प्रमुख चीनी स्टार्टअप, एक न्यूनतम लागत पर एक प्रतिस्पर्धी एआई मॉडल विकसित करने का दावा करता है, जिसमें कहा गया है कि उन्होंने केवल 2048 ग्राफिक्स प्रोसेसर का उपयोग करके दीपसेक वी 3 को प्रशिक्षित करने पर केवल $ 6 मिलियन खर्च किए हैं। हालांकि, सेमियनलिसिस के विश्लेषकों ने खुलासा किया है कि डीपसेक एक विशाल कम्प्यूटेशनल इन्फ्रास्ट्रक्चर का संचालन करता है, जिसमें लगभग 50,000 एनवीडिया हॉपर जीपीयू का उपयोग किया जाता है, जिसमें 10,000 H800 यूनिट, 10,000 H100 और अतिरिक्त H20 GPU शामिल हैं। ये संसाधन कई डेटा केंद्रों में फैले हुए हैं और एआई प्रशिक्षण, अनुसंधान और वित्तीय मॉडलिंग के लिए उपयोग किए जाते हैं।
सर्वर में कंपनी का कुल निवेश लगभग 1.6 बिलियन डॉलर है, जिसमें परिचालन खर्च $ 944 मिलियन है। दीपसेक चीनी हेज फंड हाई-फ्लायर की एक सहायक कंपनी है, जिसने इसे 2023 में एक अलग एआई-केंद्रित डिवीजन के रूप में स्थापित किया है। क्लाउड कंप्यूटिंग पर भरोसा करने वाले अधिकांश स्टार्टअप्स के विपरीत, डीपसेक अपने डेटा केंद्रों का मालिक है, एआई मॉडल अनुकूलन और तेजी से नवाचार कार्यान्वयन पर पूर्ण नियंत्रण की अनुमति देता है। कंपनी स्व-वित्त पोषित है, अपनी लचीलापन और निर्णय लेने की गति को बढ़ाती है।
चित्र: ensigame.com
दीपसेक भी शीर्ष प्रतिभाओं को आकर्षित करता है, कुछ शोधकर्ताओं ने सालाना 1.3 मिलियन डॉलर से अधिक की कमाई की, मुख्य रूप से प्रमुख चीनी विश्वविद्यालयों से। इसके बावजूद, DEEPSEEK V3 को केवल $ 6 मिलियन के प्रशिक्षण का दावा अवास्तविक लगता है, क्योंकि यह आंकड़ा केवल पूर्व-प्रशिक्षण के दौरान GPU उपयोग के लिए जिम्मेदार है और अनुसंधान, मॉडल शोधन, डेटा प्रसंस्करण और बुनियादी ढांचे की लागत को बाहर करता है।
अपनी शुरुआत के बाद से, डीपसेक ने एआई विकास में $ 500 मिलियन से अधिक का निवेश किया है। इसकी कॉम्पैक्ट संरचना बड़ी, अधिक नौकरशाही कंपनियों के विपरीत, एआई नवाचारों के सक्रिय और प्रभावी कार्यान्वयन के लिए अनुमति देती है।
चित्र: ensigame.com
दीपसेक के उदाहरण से पता चलता है कि एक अच्छी तरह से वित्त पोषित, स्वतंत्र एआई कंपनी उद्योग के नेताओं के साथ प्रतिस्पर्धा कर सकती है। हालांकि, विशेषज्ञ ध्यान देते हैं कि कंपनी की सफलता एआई मॉडल के विकास के लिए "क्रांतिकारी बजट" के बजाय महत्वपूर्ण निवेश, तकनीकी सफलताओं और एक मजबूत टीम के कारण है।
चित्र: ensigame.com
इसके बावजूद, डीपसेक की लागत उसके प्रतिद्वंद्वियों की तुलना में कम है। उदाहरण के लिए, जबकि दीपसेक ने R1 पर $ 5 मिलियन खर्च किए, Chatgpt4o के लिए प्रशिक्षण लागत $ 100 मिलियन थी। हालांकि, यह अभी भी अपने प्रतिद्वंद्वियों की तुलना में सस्ता है।