प्रारंभिक परीक्षा

Prev Next

‘लार्ज लैंग्वेज मॉडल्स’ का प्रशिक्षण

26 Feb 2026
59 min read

चर्चा में क्यों?

इंडिया-AI इंपैक्ट समिट 2026 में सर्वम AI ने दो स्वदेशी लार्ज लैंग्वेज मॉडल (LLM) का अनावरण किया, जो भारत के AI ईकोसिस्टम में एक महत्त्वपूर्ण कदम है।

इन मॉडलों को विशेष रूप से भारतीय भाषाओं में उत्कृष्ट प्रदर्शन करने और निम्न विद्युत् तथा कंप्यूटिंग ऊर्जा की खपत के लिये डिज़ाइन किया गया है। यह भारत की कम लागत पर, स्थानीय रूप से प्रासंगिक LLM प्रशिक्षण प्रदान करने की बढ़ती क्षमता को दर्शाता है।

लार्ज लैंग्वेज मॉडल्स (LLM) को किस प्रकार प्रशिक्षित किया जाता है?

लार्ज लैंग्वेज मॉडल (LLM): यह एक कृत्रिम बुद्धिमत्ता प्रणाली है जो मानव भाषा को समझने, उसकी व्याख्या करने और उसे उत्पन्न करने में सक्षम है। इसका निर्माण ट्रांसफॉर्मर-बेस्ड न्यूरल नेटवर्क का उपयोग करके किया जाता है।
- LLM विशाल डेटासेट पर प्रशिक्षित होते हैं और डीप लर्निंग का उपयोग करते हुए यह सीखते हैं कि शब्दों और वाक्यों के बीच क्या संबंध हैं, इस प्रकार वे पाठ में पैटर्न को पहचानते हैं।
- इनका प्रदर्शन डेटा की गुणवत्ता पर निर्भर करता है। इन्हें अनुवाद, सारांश और प्रश्नोत्तर जैसे विशिष्ट कार्यों के लिये बेहतर बनाया जाता है।

प्रशिक्षण

डेटा संग्रह और पूर्व-प्रसंस्करण: LLM (लार्ज लैंग्वेज मॉडल) के प्रशिक्षण की शुरुआत डेटा संग्रह और पूर्व-प्रसंस्करण से होती है। इसमें इंटरनेट, किताबें, विकिपीडिया और कोड रिपॉजिटरी जैसे स्रोतों से पाठ का एक विशाल संग्रह एकत्रित किया जाता है।
- पाठ को टोकन (शब्दों या उपशब्दों की छोटी इकाइयाँ) में परिवर्तित किया जाता है ताकि मशीनें इसे संसाधित कर सकें।
- इसके बाद डेटा को शुद्ध किया जाता है, जिसमें स्पैम, दोहराव, पक्षपातपूर्ण और हानिकारक सामग्री को हटाया जाता है। यह प्रक्रिया सुनिश्चित करती है कि मॉडल सही, विश्वसनीय और उच्च-गुणवत्ता वाले भाषा पैटर्न को प्रभावी ढंग से सीख सके।
पूर्व-प्रशिक्षण (स्व-पर्यवेक्षित शिक्षण): पूर्व-प्रशिक्षण चरण में, मॉडल नेक्स्ट-टोकन प्रेडिक्शन का उपयोग करके भाषा के पैटर्न सीखता है, जिसके अंतर्गत वह दिये गए वाक्य में अगले शब्द का अनुमान लगाता है।
- अधिकांश आधुनिक लार्ज लैंग्वेज मॉडल (LLMs) ट्रांसफॉर्मर आर्किटेक्चर का उपयोग करते हैं, जिसमें सेल्फ-अटेंशन तकनीक होती है। इससे वे दूर-दूर स्थित शब्दों के बीच संबंधों को समझने में सक्षम होते हैं।
- इस चरण में एक ऐसा आधारभूत मॉडल तैयार होता है, जो व्याकरण, तथ्यों और तर्क को समझता है, लेकिन अभी निर्देशों का प्रभावी ढंग से पालन करने में पूरी तरह सक्षम नहीं होता।
पर्यवेक्षित फाइन-ट्यूनिंग (इंस्ट्रक्शन ट्यूनिंग): पर्यवेक्षित फाइन-ट्यूनिंग के दौरान मॉडल को मानव विशेषज्ञों द्वारा बनाए गए चयनित प्रॉम्प्ट-रिस्पॉन्स युग्मों पर प्रशिक्षित किया जाता है।
- यह मॉडल को निर्देशों पर प्रतिक्रिया देना, प्रश्नों के उत्तर देना और सारांश बनाने जैसे कार्य करना सिखाता है।
- इससे मॉडल संवाद के प्रारूप को समझकर वास्तविक दुनिया के अनुप्रयोगों में अधिक उपयोगी बन जाता है।
RLHF का उपयोग करके संरेखण: संरेखण प्रक्रिया के दौरान मॉडल को सुरक्षित, निष्पक्ष और सहायक प्रतिक्रियाएँ देने के लिये सुनिश्चित करने हेतु डेवलपर RLHF (मानव प्रतिक्रिया से सुदृढ़ीकरण सीखना) का उपयोग करते हैं।
- मॉडल कई उत्तर प्रदान करता है। मनुष्य गुणवत्ता और सुरक्षा के आधार पर इन उत्तरों को क्रमबद्ध करते हैं।
- एक रिवार्ड मॉडल इस क्रमबद्धता (प्राथमिकताओं) को सीखता है। इस तरह LLM को मानवीय मूल्यों और नैतिक मानकों के अनुरूप प्रतिक्रियाएँ देने के लिये अनुकूलित किया जाता है।
भारत में LLM (लॉन्ग-लेवल लर्निंग) को प्रशिक्षित करने की सीमाएँ: भारतीय AI मॉडल कई बाधाओं का सामना करते हैं, जिनमें भारतीय भाषाओं में उच्च-गुणवत्ता वाले डेटासेट की कमी शामिल है, जो सटीकता और समावेशिता को प्रभावित करती है।
- कई मॉडल प्रदर्शन को बेहतर बनाने के लिये इनपुट को अंग्रेज़ी में अनुवाद करके अधिक टोकन का उपभोग करते हैं, जिससे कंप्यूटेशनल लागत बढ़ जाती है।
- इसके अतिरिक्त, सीमित पूंजी उपलब्धता और त्वरित वाणिज्यिक उपयोग के मामलों की कमी के कारण भारत में LLM (अध्ययनीय स्तर पर स्नातकोत्तर शिक्षा) प्रशिक्षण चुनौतीपूर्ण बना हुआ है, जो घरेलू AI विकास में बड़े पैमाने पर निवेश को बाधित करता है।

नोट: प्रारंभिक लार्ज लैंग्वेज मॉडल, जिनमें सैकड़ों अरब या यहाँ तक कि खरबों पैरामीटर होते थे, अनुमान के दौरान सभी पैरामीटर सक्रिय करके प्रश्नों को संसाधित करते थे, जिससे वे संगणनात्मक रूप से महंगे और संसाधन-गहन हो जाते थे।

नए मॉडल मिक्सचर ऑफ एक्सपर्ट्स (MoE) का उपयोग करते हैं, जो एक AI मॉडल आर्किटेक्चर है जिसमें संपूर्ण मॉडल का उपयोग करने के स्थान पर प्रत्येक प्रश्न के लिये पैरामीटरों का केवल एक छोटा उप-समूह ("विशेषज्ञ") सक्रिय किया जाता है।
यह लार्ज लैंग्वेज मॉडल को तेज़, सस्ता और अधिक संगणना-कुशल बनाता है, जिससे भारत जैसे संसाधन-बाधित वातावरण में लागत-प्रभावी कार्यान्वयन संभव होता है।
सर्वम के 105 अरब पैरामीटर वाले LLM और भारतजेन के बहुभाषी 17 अरब पैरामीटर वाले मॉडल जैसे भारतीय मॉडल स्थानीय भाषाओं और शिक्षा एवं स्वास्थ्य सेवा जैसे क्षेत्रों का समर्थन करने के लिये दक्षता-केंद्रित दृष्टिकोण का उपयोग करते हैं।

इंडिया AI मिशन

मार्च 2024 में 10,372 करोड़ रुपये के परिव्यय के साथ शुरू किया गया, इंडिया AI मिशन का उद्देश्य भारत में एक व्यापक AI ईकोसिस्टम का निर्माण करना है।
मिशन के तहत सरकार ने भारतीय डेटा सेंटर में 36,000 से अधिक ग्राफिक्स प्रोसेसिंग यूनिट (GPU) स्थापित किये हैं और 20,000 और जोड़कर क्षमता का विस्तार कर रही है, जिसका लक्ष्य वर्ष 2026 के अंत तक 100,000 GPU से अधिक करना है।
- सर्वम AI जैसे स्टार्टअप को AI प्रशिक्षण और अनुमान के लिये कंप्यूट अवसंरचना तक सब्सिडी वाली पहुँच प्राप्त हुई है। सर्वम AI को कॉमन कंप्यूट क्लस्टर से 4,096 GPU तक पहुँच प्रदान की गई, जिसमें लगभग 100 करोड़ रुपये की सब्सिडी शामिल थी।
यह मिशन 13,500 से अधिक छात्रों के लिये प्रतिभा विकास का भी समर्थन करता है, इंडिया डेटा एंड AI लैब्स की स्थापना कर रहा है और भारतीय डेटासेट पर प्रशिक्षित संप्रभु आधारभूत मॉडलों को बढ़ावा देता है, जिसमें खुले स्रोत नवाचार और स्टार्टअप वृद्धि को बढ़ावा देने के लिये कंप्यूट और संबंधित लागतों को कवर करने वाली वित्तीय सहायता शामिल है।

अक्सर पूछे जाने वाले प्रश्न

लार्ज लैंग्वेज मॉडल (LLM) क्या है?
LLM एक ट्रांसफार्मर-आधारित AI प्रणाली है जिसे गहन शिक्षण का उपयोग करके मानव भाषा को समझने के लिये बड़े पैमाने के डेटासेट पर प्रशिक्षित किया जाता है।

AI में मिक्सचर ऑफ एक्सपर्ट्स (MoE) आर्किटेक्चर क्या है?
MoE प्रति प्रश्न मॉडल मापदंडों के केवल एक उप-समूह को सक्रिय करता है, जिससे LLM कार्यान्वयन में कंप्यूट लागत कम होती है और दक्षता में सुधार होता है।

इंडिया AI मिशन का उद्देश्य क्या है?
इसका उद्देश्य कंप्यूट इंफ्रास्ट्रक्चर, स्वदेशी मॉडल, डेटासेट और प्रतिभा विकास के माध्यम से एक संप्रभु AI पारिस्थितिक तंत्र का निर्माण करना है।

भारत के लिये स्वदेशी LLM महत्त्वपूर्ण क्यों हैं?
वे भारतीय भाषा समर्थन में सुधार करते हैं, डेटा संप्रभुता सुनिश्चित करते हैं और विदेशी AI प्लेटफॉर्मों पर निर्भरता कम करते हैं।

RLHF AI मॉडल में कैसे सुधार करता है?
मानव प्रतिक्रिया से सुदृढ़ीकरण सीखना, AI आउटपुट को मानवीय मूल्यों के साथ संरेखित करता है, जिससे सुरक्षा, सटीकता और नैतिक प्रतिक्रियाएँ सुनिश्चित होती हैं।

UPSC सिविल सेवा परीक्षा, विगत वर्ष के प्रश्न

प्रारंभिक परीक्षा

प्रश्न. विकास की वर्तमान स्थिति में, कृत्रिम बुद्धिमत्ता (Artificial Intelligence), निम्नलिखित में से किस कार्य को प्रभावी रूप से कर सकती है? (2020)

औद्योगिक इकाइयों में विद्युत् की खपत कम करना
सार्थक लघु कहानियों और गीतों की रचना
रोगों का निदान
टेक्स्ट से स्पीच (Text- to- Speech) में परिवर्तन
विद्युत् ऊर्जा का बेतार संचरण

नीचे दिये गए कूट का प्रयोग कर सही उत्तर चुनिये:

(a) केवल 1, 2, 3 और 5

(b) केवल 1, 3 और 4

(d) 1, 2, 3, 4 और 5

उत्तर: (b)

प्रिंट पीडीएफ लेख को प्रिंट करें

एचीवर्स कॉर्नर

हमारे बारे में

प्रारंभिक परीक्षा

मुख्य परीक्षा

पी.सी.एस.

टेस्ट सीरीज़

करेंट अफेयर्स

दृष्टि स्पेशल्स

डाउनलोड्स

वीडियो सेक्शन

सिविल सेवा परीक्षा

डेली अपडेट्स

प्रारंभिक परीक्षा

‘लार्ज लैंग्वेज मॉडल्स’ का प्रशिक्षण

चर्चा में क्यों?

लार्ज लैंग्वेज मॉडल्स (LLM) को किस प्रकार प्रशिक्षित किया जाता है?

प्रशिक्षण

इंडिया AI मिशन

अक्सर पूछे जाने वाले प्रश्न

UPSC सिविल सेवा परीक्षा, विगत वर्ष के प्रश्न

प्रारंभिक परीक्षा