LLM என்பது அடுத்த JPEG
நான் ஒரு கதை சொல்லட்டுமா.
1990களில், நீங்கள் ஒரு புகைப்படத்தை யாருக்காவது அனுப்ப விரும்பினால், நீங்கள் நிறைய விஷயங்களைக் கருத்தில் கொள்ள வேண்டும்: கோப்பு வடிவம், சுருக்க அல்காரிதம், வண்ண ஆழம். ஒவ்வொரு மென்பொருளுக்கும் அதன் சொந்த வடிவம் இருந்தது. பின்னர் JPEG வந்தது.
திடீரென்று, யாரும் பட வடிவத்தைப் பற்றி கவலைப்படவில்லை. JPEG ஒரு உள்கட்டமைப்பாக மாறியது. நீங்கள் "நான் JPEG ஐப் பயன்படுத்தி ஒரு படத்தை உருவாக்கினேன்" என்று சொல்ல மாட்டீர்கள், நீங்கள் "நான் ஒரு படத்தை அனுப்பினேன்" என்று மட்டுமே சொல்வீர்கள்.
LLM அதே பாதையில் சென்று கொண்டிருக்கிறது.
தொழில்நுட்பம் காற்றாக மாறும் போது
"LLM என்பது ஒரு பொருள். ஆப்பிள் LLM நிறுவனங்களிடமிருந்து டோக்கன்களை வாங்க மகிழ்ச்சியாக உள்ளது, ஆனால் ஆப்பிள் ஒரு வேறுபட்ட தயாரிப்புகளை விற்கும் நிறுவனம்." — @deuteronormative
இந்த வாக்கியம் நேரடியாகச் சொல்கிறது. நீங்கள் ஆப்பிள் என்றால், நீங்கள் சொந்தமாக மின்சாரம் உற்பத்தி செய்ய மாட்டீர்கள், நீங்கள் மின் கட்டத்திலிருந்து மின்சாரம் வாங்குகிறீர்கள். நீங்கள் சொந்தமாக டயர்களை உருவாக்க மாட்டீர்கள், நீங்கள் மிச்செலினிடம் இருந்து டயர்களை வாங்குகிறீர்கள். இப்போது, நீங்கள் சொந்தமாக LLM ஐப் பயிற்றுவிக்க மாட்டீர்கள், நீங்கள் கிளவுடில் இருந்து டோக்கன்களை வாங்குகிறீர்கள்.
இது LLM முக்கியமில்லை என்று அர்த்தமல்ல. மின்சாரம் முக்கியமானது. டயர்கள் முக்கியம். ஆனால் அவை உள்கட்டமைப்பு, வேறுபடுத்தும் காரணிகள் அல்ல.
செலவு போரில் வெற்றியாளர்
அலிபாபா சமீபத்தில் வெளியிட்ட Qwen 3.5:
- 397 பில்லியன் அளவுருக்கள், 17 பில்லியன் செயல்படுத்தப்பட்டது
- Qwen 3 ஐ விட 60% மலிவானது
- 8 மடங்கு வேகம்
- டோக்கன் விலை Gemini 3 Pro இன் 1/18
இது தொழில்நுட்ப முன்னேற்றம் அல்ல, இது விலை போர். LCD தொலைக்காட்சிகளின் விலையும் இப்படித்தான் குறைந்தது. 1000 டாலர்களுக்குக் குறைவாகக் குறைந்த முதல் நிறுவனம் சிறந்த தொழில்நுட்பத்தைக் கொண்டிருக்கவில்லை, ஆனால் அதுதான் வெற்றியாளர்.
நடைமுறை ஆலோசனை
நீங்கள் ஒரு டெவலப்பராக இருந்தால், இதன் பொருள் என்ன?
-
சொந்தமாக மாடல்களைப் பயிற்றுவிக்க வேண்டாம். நீங்கள் OpenAI, Anthropic அல்லது Alibaba ஆக இல்லாவிட்டால், மாடல்களைப் பயிற்றுவிப்பது பணத்தை எரிப்பதாகும். API ஐப் பயன்படுத்தவும்.
-
அளவுருக்களை விட விலையில் கவனம் செலுத்துங்கள். 397 பில்லியன் அளவுருக்கள் இருப்பது அருமையாகத் தோன்றலாம், ஆனால் உங்கள் பயனர்கள் அதைப் பற்றிக் கவலைப்படுவதில்லை. அவர்கள் பதில் வேகம் மற்றும் செலவைப் பற்றிக் கவலைப்படுகிறார்கள்.
-
இடமாற்றத்திற்கு தயாராகுங்கள். LLM என்பது ஒரு பொருள், அதாவது மாற்றக்கூடியது. இன்று GPT ஐப் பயன்படுத்துங்கள், நாளை Claude ஐப் பயன்படுத்துங்கள், நாளை மறுநாள் Qwen ஐப் பயன்படுத்துங்கள். உங்கள் கட்டமைப்பு இந்த மாற்றத்தை ஆதரிக்க வேண்டும்.
சுவாரஸ்யமான முரண்பாடு
LLM பற்றி அதிகம் தெரிந்தவர்கள் LLM பற்றி அதிகம் பேசுவதில்லை.
"Andrej Karpathy 240 வரிகள் கொண்ட தூய பைத்தானில் ஒரு மினி GPT ஐ எழுதினார். TensorFlow இல்லை. PyTorch இல்லை. கணிதம் மட்டுமே. LLM என்பது மந்திரம் அல்ல - அவை அடுத்த டோக்கன் கணிப்பு மட்டுமே என்பதை இது காட்டுகிறது."
"அடுத்த டோக்கன் கணிப்பு" என்பது இந்த தொழில்நுட்பத்தின் முழு அம்சம் என்பதை நீங்கள் புரிந்து கொள்ளும்போது, நிறைய விளம்பரங்கள் மறைந்துவிடும். இது குறைத்து மதிப்பிடுவது அல்ல. மைக்ரோவேவ் அடுப்பு நீர் மூலக்கூறுகளை சூடாக்குகிறது, ஆனால் அது சமையலறையை மாற்றுகிறது.
அடுத்த கட்டம்
LLM என்பது JPEG போன்ற ஒன்றாக மாறும்: எல்லா இடங்களிலும் இருக்கும், யாரும் விவாதிக்க மாட்டார்கள், ஆனால் இன்றியமையாதது.
அதுவரை, புத்திசாலிகள் விலை போரில் மலிவான சப்ளையரைத் தேர்ந்தெடுப்பார்கள். ஏனெனில் தொழில்நுட்பம் வணிகமயமாக்கப்படும்போது, முக்கியமானது செலவு மட்டுமே.





