LLM એ આગામી JPEG છે
ચાલો હું તમને એક વાર્તા કહું.
1990 ના દાયકામાં, જો તમે કોઈને ફોટો મોકલવા માંગતા હો, તો તમારે ઘણી બાબતો ધ્યાનમાં લેવાની જરૂર હતી: ફાઇલ ફોર્મેટ, કમ્પ્રેશન એલ્ગોરિધમ, કલર ડેપ્થ. દરેક સોફ્ટવેરનું પોતાનું ફોર્મેટ હતું. પછી JPEG આવ્યું.
અચાનક, કોઈને પણ ઇમેજ ફોર્મેટની પરવા ન રહી. JPEG ઇન્ફ્રાસ્ટ્રક્ચર બની ગયું. તમે એમ નહીં કહો કે "મેં JPEG થી એક ચિત્ર બનાવ્યું", તમે ફક્ત એમ જ કહેશો કે "મેં એક ચિત્ર મોકલ્યું".
LLM પણ એ જ રસ્તે જઈ રહ્યું છે.
જ્યારે ટેક્નોલોજી હવા બની જાય છે
"LLM એક કોમોડિટી છે. Apple LLM કંપનીઓ પાસેથી ટોકન્સ ખરીદવામાં ખુશ છે, પરંતુ Apple એક એવી કંપની છે જે વિભેદક ઉત્પાદનો વેચે છે." — @deuteronormative
આ વાત સીધી છે. જો તમે Apple હો, તો તમે તમારી પોતાની વીજળી ઉત્પન્ન નહીં કરો, તમે ગ્રીડમાંથી વીજળી ખરીદશો. તમે તમારા પોતાના ટાયર બનાવશો નહીં, તમે મિશેલિન પાસેથી ટાયર ખરીદશો. હવે, તમે તમારું પોતાનું LLM પણ તાલીમ નહીં આપો, તમે ક્લાઉડમાંથી ટોકન્સ ખરીદશો.
આનો અર્થ એ નથી કે LLM મહત્વપૂર્ણ નથી. વીજળી મહત્વપૂર્ણ છે. ટાયર મહત્વપૂર્ણ છે. પરંતુ તે ઇન્ફ્રાસ્ટ્રક્ચર છે, વિભેદક પરિબળ નથી.
કિંમત યુદ્ધના વિજેતા
અલીબાબા દ્વારા તાજેતરમાં જ બહાર પાડવામાં આવેલ Qwen 3.5:
- 397 અબજ પરિમાણો, 17 અબજ સક્રિય
- Qwen 3 કરતા 60% સસ્તું
- 8 ગણી ઝડપી
- ટોકન કિંમત Gemini 3 Pro કરતા 1/18 છે
આ કોઈ ટેક્નોલોજીકલ સફળતા નથી, આ કિંમત યુદ્ધ છે. LCD ટીવીની કિંમતો પણ આ રીતે જ ઘટી હતી. 1000 ડોલરથી નીચે આવનારી પ્રથમ કંપની શ્રેષ્ઠ ટેક્નોલોજી ધરાવતી ન હતી, પરંતુ તે વિજેતા હતી.
વ્યવહારિક સલાહ
જો તમે ડેવલપર છો, તો આનો અર્થ શું થાય છે?
-
તમારા પોતાના મોડેલને તાલીમ આપશો નહીં. જ્યાં સુધી તમે OpenAI, Anthropic અથવા અલીબાબા ન હો, ત્યાં સુધી મોડેલને તાલીમ આપવી એ પૈસા બાળવા જેવું છે. API નો ઉપયોગ કરો.
-
પરિમાણોને બદલે કિંમત પર ધ્યાન કેન્દ્રિત કરો. 397 અબજ પરિમાણો સાંભળવામાં સરસ લાગે છે, પરંતુ તમારા વપરાશકર્તાઓને તેની પરવા નથી. તેઓ પ્રતિભાવની ઝડપ અને કિંમતની કાળજી લે છે.
-
સ્થળાંતર કરવા માટે તૈયાર રહો. LLM એક કોમોડિટી છે, જેનો અર્થ છે કે તે બદલી શકાય તેવું છે. આજે GPT નો ઉપયોગ કરો, કાલે Claude નો ઉપયોગ કરો, પછીના દિવસે Qwen નો ઉપયોગ કરો. તમારા આર્કિટેક્ચરે આ સ્વિચને સપોર્ટ કરવો જોઈએ.
રસપ્રદ વિરોધાભાસ
જે લોકો LLM ને સૌથી વધુ સમજે છે તેઓ LLM વિશે બહુ વાત કરતા નથી.
"Andrej Karpathy એ 240 લીટીઓના શુદ્ધ Python માં એક મીની GPT લખ્યું. કોઈ TensorFlow નથી. કોઈ PyTorch નથી. ફક્ત ગણિત છે. તે દર્શાવે છે કે LLM કોઈ જાદુ નથી - તે ફક્ત આગામી ટોકન આગાહી છે." (Andrej Karpathy wrote a mini GPT in 240 lines of pure Python. No TensorFlow. No PyTorch. Just math. It shows that LLMs are not magic—they are just next token prediction.)
જ્યારે તમે સમજો છો કે "આગામી ટોકન આગાહી" એ આ ટેક્નોલોજીનો સાર છે, ત્યારે ઘણી બધી અતિશયોક્તિઓ અદૃશ્ય થઈ જાય છે. આ કોઈ અપમાન નથી. માઇક્રોવેવ ફક્ત પાણીના અણુઓને ગરમ કરે છે, પરંતુ તેણે રસોડું બદલી નાખ્યું છે.
આગળ શું
LLM JPEG જેવી વસ્તુ બની જશે: સર્વવ્યાપક, જેના વિશે કોઈ વાત કરતું નથી, પરંતુ આવશ્યક છે.
ત્યાં સુધી, હોશિયાર લોકો કિંમત યુદ્ધમાં સૌથી સસ્તા સપ્લાયરને પસંદ કરશે. કારણ કે જ્યારે ટેક્નોલોજી કોમોડિટી બની જાય છે, ત્યારે ફક્ત કિંમત જ મહત્વપૂર્ણ હોય છે.





