सर्वम AI ने 'विक्रम' LLM लॉन्च किया | 19 Feb 2026
बंगलूरू स्थित स्टार्टअप सर्वम AI ने 'इंडिया-एआई इंपैक्ट समिट 2026' में 'विक्रम' नाम से दो नए लार्ज लैंग्वेज मॉडल (LLM) का अनावरण किया है।
- यह लॉन्च ओपन AI द्वारा 'IndQA' पेश किये जाने के बीच हुआ है, जो भारतीय भाषाओं और सांस्कृतिक संदर्भों की समझ का आकलन करने वाला एक बेंचमार्क है। यह भारत पर बढ़ते वैश्विक ध्यान को दर्शाता है।
- स्वदेशी विकास: इन मॉडलों को ‘विक्रम’ नाम दिया गया है, जिन्हें सर्वम AI ने विकसित किया है, इनमें 30 बिलियन पैरामीटर (30B) वाला मॉडल तथा 105 बिलियन पैरामीटर (105B) वाला मॉडल शामिल है।
- पैरामीटर AI मॉडल के इंटरनल वेरिएबल या उसके “ब्रेन सेल्स” होते हैं, जो प्रशिक्षण के दौरान सीखे जाते हैं; उच्च पैरामीटर संख्या सामान्यतः अधिक जटिलता, तर्क‑क्षमता और सूक्ष्म कार्यों को सँभालने की अधिक क्षमता वाले मॉडल की ओर संकेत करती है।
- प्रमुख विशेषता और क्षमता
- भारतीय भाषाओं में महारथ: GPT-4 जैसे वैश्विक मॉडलों के विपरीत, जो मुख्य रूप से अंग्रेज़ी डेटा पर प्रशिक्षित हैं, विक्रम को सभी 22 भारतीय भाषाओं में उत्कृष्टता प्राप्त करने के लिये बनाया गया है, जिसमें वॉइस-फर्स्ट ऑप्टिमाइज़ेशन के साथ, 105B-पैरामीटर (डीपसीक के 600B R1 मॉडल के आकार का एक-छठा हिस्सा) के बावजूद AI को जनता के लिये अधिक सुलभ बनाया गया है।
- यह भारतीय भाषाओं में "डेटा की कमी" की समस्या को दूर करता है, जिससे स्थानीय बोलियों में सटीक अनुवाद और कंटेंट जनरेशन संभव हो पाता है।
- ओपन सोर्स: इन मॉडलों को ओपन सोर्स के रूप में जारी किया जाएगा, जिसका अर्थ है कि डेवलपर्स और शोधकर्त्ता 'विक्रम' के आधार पर अपने स्वयं के एप्लिकेशन बनाने के लिये इसके कोड और वेट्स तक पहुँच सकते हैं।
- भारतीय भाषाओं में महारथ: GPT-4 जैसे वैश्विक मॉडलों के विपरीत, जो मुख्य रूप से अंग्रेज़ी डेटा पर प्रशिक्षित हैं, विक्रम को सभी 22 भारतीय भाषाओं में उत्कृष्टता प्राप्त करने के लिये बनाया गया है, जिसमें वॉइस-फर्स्ट ऑप्टिमाइज़ेशन के साथ, 105B-पैरामीटर (डीपसीक के 600B R1 मॉडल के आकार का एक-छठा हिस्सा) के बावजूद AI को जनता के लिये अधिक सुलभ बनाया गया है।
- प्रशिक्षण बुनियादी ढाँचा: LLM को प्रशिक्षित करने के लिये अत्यधिक कंप्यूटिंग शक्ति की आवश्यकता होती है। विक्रम जैसे मॉडलों को IndiaAI मिशन के 'कॉमन कंप्यूट प्रोग्राम' के माध्यम से एक्सेस किये गए GPU (ग्राफिक्स प्रोसेसिंग यूनिट्स) का उपयोग करके प्रशिक्षित किया गया है, जो सार्वजनिक-निजी भागीदारी की सफलता को दर्शाता है।
- IndiaAI मिशन के तहत सर्वम AI को शासन और सार्वजनिक सेवाओं के लिये एक ओपन-सोर्स 120B-पैरामीटर मॉडल के साथ भारत का पहला सोवरेन LLM ईकोसिस्टम निर्माण के लिये चुना गया है।
- सर्वम AI के अतिरिक्त, सोकेट AI रक्षा, स्वास्थ्य सेवा और शिक्षा जैसे क्षेत्रों के लिये भारत-केंद्रित मॉडल विकसित करेगा। वहीं Gnani ने अपना मॉडल लॉन्च किया है और Gan AI एक 70B-पैरामीटर वाला मल्टीलिंगुअल 'टेक्स्ट-टू-स्पीच' फाउंडेशन मॉडल का निर्माण कर रहा है।
- विज्ञान को श्रद्धांजलि: इस चैटबॉट और मॉडलों का नाम भारतीय अंतरिक्ष कार्यक्रम के जनक विक्रम साराभाई के सम्मान में "विक्रम" रखा गया है।
|
और पढ़ें: सर्वम AI और भारत में सॉवरेन AI |