एलएलएम अगला जेपीईजी है
मुझे एक कहानी बताने दो।
1990 के दशक में, यदि आप किसी को एक तस्वीर भेजना चाहते थे, तो आपको बहुत सी बातों पर विचार करना पड़ता था: फ़ाइल प्रारूप, संपीड़न एल्गोरिदम, रंग गहराई। प्रत्येक सॉफ़्टवेयर का अपना प्रारूप था। फिर जेपीईजी आया।
अचानक, किसी को भी छवि प्रारूप की परवाह नहीं रही। जेपीईजी एक बुनियादी ढांचा बन गया। आप यह नहीं कहेंगे कि "मैंने जेपीईजी का उपयोग करके एक छवि बनाई", आप केवल यह कहेंगे कि "मैंने एक छवि भेजी"।
एलएलएम उसी रास्ते पर चल रहा है।
जब तकनीक हवा बन जाती है
"एलएलएम एक कमोडिटी है। ऐप्पल एलएलएम कंपनियों से टोकन खरीदने में खुश है, लेकिन ऐप्पल एक विभेदित उत्पाद बेचने वाली कंपनी है।" - @deuteronormative
यह कथन स्पष्ट है। यदि आप ऐप्पल हैं, तो आप अपनी खुद की बिजली उत्पन्न नहीं करेंगे, आप ग्रिड से बिजली खरीदेंगे। आप अपने खुद के टायर नहीं बनाएंगे, आप मिशेलिन से टायर खरीदेंगे। अब, आप अपने खुद के एलएलएम को प्रशिक्षित नहीं करेंगे, आप क्लाउड से टोकन खरीदेंगे।
यह कहने का मतलब यह नहीं है कि एलएलएम महत्वपूर्ण नहीं है। बिजली महत्वपूर्ण है। टायर महत्वपूर्ण हैं। लेकिन वे बुनियादी ढांचा हैं, विभेदन कारक नहीं।
लागत युद्ध का विजेता
अलीबाबा द्वारा हाल ही में जारी किया गया Qwen 3.5:
- 397 बिलियन पैरामीटर, 17 बिलियन सक्रिय
- Qwen 3 से 60% सस्ता
- 8 गुना तेज
- टोकन की कीमत Gemini 3 Pro का 1/18 है
यह कोई तकनीकी सफलता नहीं है, यह मूल्य युद्ध है। एलसीडी टीवी की कीमतें भी इसी तरह गिरीं। 1000 डॉलर से नीचे गिरने वाली पहली कंपनी सबसे अच्छी तकनीक वाली नहीं थी, लेकिन वह विजेता थी।
व्यावहारिक सलाह
यदि आप एक डेवलपर हैं, तो इसका क्या मतलब है?
-
अपने खुद के मॉडल को प्रशिक्षित न करें। जब तक आप OpenAI, Anthropic या अलीबाबा नहीं हैं, मॉडल को प्रशिक्षित करना पैसे की बर्बादी है। एपीआई का उपयोग करें।
-
पैरामीटर के बजाय कीमत पर ध्यान दें। 397 बिलियन पैरामीटर सुनने में अच्छे लगते हैं, लेकिन आपके उपयोगकर्ताओं को इसकी परवाह नहीं है। उन्हें प्रतिक्रिया की गति और लागत की परवाह है।
-
स्थानांतरण के लिए तैयार रहें। एलएलएम एक कमोडिटी है, जिसका अर्थ है कि इसे बदला जा सकता है। आज जीपीटी का उपयोग करें, कल क्लाउड का उपयोग करें, और अगले दिन Qwen का उपयोग करें। आपके आर्किटेक्चर को इस स्विच का समर्थन करना चाहिए।
दिलचस्प विरोधाभास
एलएलएम को सबसे अच्छी तरह से समझने वाले लोग एलएलएम के बारे में ज्यादा बात नहीं करते हैं।
"Andrej Karpathy ने 240 पंक्तियों के शुद्ध पायथन में एक मिनी जीपीटी लिखा। कोई TensorFlow नहीं। कोई PyTorch नहीं। केवल गणित। यह दर्शाता है कि एलएलएम जादू नहीं हैं - वे केवल अगले टोकन की भविष्यवाणी हैं।"
जब आप समझते हैं कि "अगला टोकन भविष्यवाणी" इस तकनीक का सब कुछ है, तो बहुत सारी हाइप गायब हो जाती है। यह कम आंकना नहीं है। माइक्रोवेव केवल पानी के अणुओं को गर्म करता है, लेकिन इसने रसोई को बदल दिया।
अगला कदम
एलएलएम जेपीईजी जैसी चीज बन जाएगी: सर्वव्यापी, कोई भी इस पर चर्चा नहीं करता है, लेकिन अपरिहार्य।
उस समय तक, बुद्धिमान लोग मूल्य युद्ध में सबसे सस्ते आपूर्तिकर्ता को चुनेंगे। क्योंकि जब तकनीक कमोडिटी बन जाती है, तो केवल लागत ही मायने रखती है।





