LLM ਅਗਲਾ JPEG ਹੈ
ਮੈਨੂੰ ਇੱਕ ਕਹਾਣੀ ਸੁਣਾਉਣ ਦਿਓ।
1990 ਦੇ ਦਹਾਕੇ ਵਿੱਚ, ਜੇ ਤੁਸੀਂ ਕਿਸੇ ਨੂੰ ਇੱਕ ਫੋਟੋ ਭੇਜਣਾ ਚਾਹੁੰਦੇ ਹੋ, ਤਾਂ ਤੁਹਾਨੂੰ ਬਹੁਤ ਸਾਰੀਆਂ ਚੀਜ਼ਾਂ ਬਾਰੇ ਸੋਚਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਸੀ: ਫਾਈਲ ਫਾਰਮੈਟ, ਕੰਪ੍ਰੈਸ਼ਨ ਐਲਗੋਰਿਦਮ, ਰੰਗ ਦੀ ਡੂੰਘਾਈ। ਹਰੇਕ ਸੌਫਟਵੇਅਰ ਦਾ ਆਪਣਾ ਫਾਰਮੈਟ ਹੁੰਦਾ ਸੀ। ਫਿਰ JPEG ਆਇਆ।
ਅਚਾਨਕ, ਕਿਸੇ ਨੇ ਵੀ ਹੁਣ ਤਸਵੀਰ ਫਾਰਮੈਟਾਂ ਦੀ ਪਰਵਾਹ ਨਹੀਂ ਕੀਤੀ। JPEG ਇੱਕ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਬਣ ਗਿਆ। ਤੁਸੀਂ ਇਹ ਨਹੀਂ ਕਹੋਗੇ "ਮੈਂ JPEG ਨਾਲ ਇੱਕ ਤਸਵੀਰ ਬਣਾਈ", ਤੁਸੀਂ ਸਿਰਫ਼ ਇਹ ਕਹੋਗੇ "ਮੈਂ ਇੱਕ ਤਸਵੀਰ ਭੇਜੀ"।
LLM ਵੀ ਉਸੇ ਰਾਹ 'ਤੇ ਚੱਲ ਰਿਹਾ ਹੈ।
ਜਦੋਂ ਤਕਨਾਲੋਜੀ ਹਵਾ ਬਣ ਜਾਂਦੀ ਹੈ
"LLM ਇੱਕ ਵਸਤੂ ਹੈ। ਐਪਲ LLM ਕੰਪਨੀਆਂ ਤੋਂ ਟੋਕਨ ਖਰੀਦਣ ਵਿੱਚ ਖੁਸ਼ ਹੈ, ਪਰ ਐਪਲ ਇੱਕ ਵਿਭਿੰਨ ਉਤਪਾਦ ਵੇਚਣ ਵਾਲੀ ਕੰਪਨੀ ਹੈ।" — @deuteronormative
ਇਹ ਗੱਲ ਸਿੱਧੀ ਹੈ। ਜੇ ਤੁਸੀਂ ਐਪਲ ਹੋ, ਤਾਂ ਤੁਸੀਂ ਖੁਦ ਬਿਜਲੀ ਨਹੀਂ ਪੈਦਾ ਕਰੋਗੇ, ਤੁਸੀਂ ਗਰਿੱਡ ਤੋਂ ਬਿਜਲੀ ਖਰੀਦੋਗੇ। ਤੁਸੀਂ ਖੁਦ ਟਾਇਰ ਨਹੀਂ ਬਣਾਓਗੇ, ਤੁਸੀਂ ਮਿਸ਼ੇਲਿਨ ਤੋਂ ਟਾਇਰ ਖਰੀਦੋਗੇ। ਹੁਣ, ਤੁਸੀਂ ਖੁਦ LLM ਨੂੰ ਸਿਖਲਾਈ ਨਹੀਂ ਦਿਓਗੇ, ਤੁਸੀਂ ਕਲਾਉਡ ਤੋਂ ਟੋਕਨ ਖਰੀਦੋਗੇ।
ਇਸਦਾ ਇਹ ਮਤਲਬ ਨਹੀਂ ਹੈ ਕਿ LLM ਮਹੱਤਵਪੂਰਨ ਨਹੀਂ ਹੈ। ਬਿਜਲੀ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਟਾਇਰ ਮਹੱਤਵਪੂਰਨ ਹਨ। ਪਰ ਉਹ ਬੁਨਿਆਦੀ ਢਾਂਚਾ ਹਨ, ਵਿਭਿੰਨਤਾ ਵਾਲੇ ਕਾਰਕ ਨਹੀਂ।
ਲਾਗਤ ਯੁੱਧ ਦਾ ਜੇਤੂ
ਅਲੀਬਾਬਾ ਦੁਆਰਾ ਹਾਲ ਹੀ ਵਿੱਚ ਜਾਰੀ ਕੀਤਾ ਗਿਆ Qwen 3.5:
- 397 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ, 17 ਬਿਲੀਅਨ ਐਕਟੀਵੇਸ਼ਨ
- Qwen 3 ਨਾਲੋਂ 60% ਸਸਤਾ
- 8 ਗੁਣਾ ਤੇਜ਼
- ਟੋਕਨ ਦੀ ਕੀਮਤ Gemini 3 Pro ਦਾ 1/18 ਹੈ
ਇਹ ਕੋਈ ਤਕਨੀਕੀ ਸਫਲਤਾ ਨਹੀਂ ਹੈ, ਇਹ ਕੀਮਤ ਯੁੱਧ ਹੈ। ਐਲਸੀਡੀ ਟੀਵੀ ਦੀ ਕੀਮਤ ਵੀ ਇਸੇ ਤਰ੍ਹਾਂ ਘਟੀ ਸੀ। 1000 ਡਾਲਰ ਤੋਂ ਘੱਟ ਕੀਮਤ ਵਾਲੀ ਪਹਿਲੀ ਕੰਪਨੀ ਸਭ ਤੋਂ ਵਧੀਆ ਤਕਨਾਲੋਜੀ ਵਾਲੀ ਨਹੀਂ ਸੀ, ਪਰ ਇਹ ਜੇਤੂ ਸੀ।
ਵਿਹਾਰਕ ਸਲਾਹ
ਜੇ ਤੁਸੀਂ ਇੱਕ ਡਿਵੈਲਪਰ ਹੋ, ਤਾਂ ਇਸਦਾ ਕੀ ਮਤਲਬ ਹੈ?
-
ਖੁਦ ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਨਾ ਦਿਓ। ਜਦੋਂ ਤੱਕ ਤੁਸੀਂ OpenAI, Anthropic ਜਾਂ ਅਲੀਬਾਬਾ ਨਹੀਂ ਹੋ, ਮਾਡਲ ਨੂੰ ਸਿਖਲਾਈ ਦੇਣਾ ਪੈਸਾ ਬਰਬਾਦ ਕਰਨਾ ਹੈ। API ਦੀ ਵਰਤੋਂ ਕਰੋ।
-
ਪੈਰਾਮੀਟਰਾਂ ਦੀ ਬਜਾਏ ਕੀਮਤ 'ਤੇ ਧਿਆਨ ਦਿਓ। 397 ਬਿਲੀਅਨ ਪੈਰਾਮੀਟਰ ਸੁਣਨ ਵਿੱਚ ਵਧੀਆ ਲੱਗਦੇ ਹਨ, ਪਰ ਤੁਹਾਡੇ ਉਪਭੋਗਤਾਵਾਂ ਨੂੰ ਇਸਦੀ ਪਰਵਾਹ ਨਹੀਂ ਹੈ। ਉਹ ਜਵਾਬ ਦੀ ਗਤੀ ਅਤੇ ਲਾਗਤ ਦੀ ਪਰਵਾਹ ਕਰਦੇ ਹਨ।
-
ਮਾਈਗ੍ਰੇਟ ਕਰਨ ਲਈ ਤਿਆਰ ਰਹੋ। LLM ਇੱਕ ਵਸਤੂ ਹੈ, ਜਿਸਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਸਨੂੰ ਬਦਲਿਆ ਜਾ ਸਕਦਾ ਹੈ। ਅੱਜ GPT ਦੀ ਵਰਤੋਂ ਕਰੋ, ਕੱਲ੍ਹ Claude ਦੀ ਵਰਤੋਂ ਕਰੋ, ਪਰਸੋਂ Qwen ਦੀ ਵਰਤੋਂ ਕਰੋ। ਤੁਹਾਡਾ ਆਰਕੀਟੈਕਚਰ ਇਸ ਤਬਦੀਲੀ ਦਾ ਸਮਰਥਨ ਕਰਨਾ ਚਾਹੀਦਾ ਹੈ।
ਦਿਲਚਸਪ ਵਿਰੋਧਾਭਾਸ
LLM ਨੂੰ ਸਭ ਤੋਂ ਵੱਧ ਸਮਝਣ ਵਾਲੇ ਲੋਕ LLM ਬਾਰੇ ਜ਼ਿਆਦਾ ਗੱਲ ਨਹੀਂ ਕਰਦੇ ਹਨ।
"Andrej Karpathy ਨੇ 240 ਲਾਈਨਾਂ ਦੀ ਸ਼ੁੱਧ Python ਵਿੱਚ ਇੱਕ ਮਿੰਨੀ GPT ਲਿਖਿਆ। ਕੋਈ TensorFlow ਨਹੀਂ। ਕੋਈ PyTorch ਨਹੀਂ। ਸਿਰਫ਼ ਗਣਿਤ। ਇਹ ਦਰਸਾਉਂਦਾ ਹੈ ਕਿ LLM ਕੋਈ ਜਾਦੂ ਨਹੀਂ ਹੈ—ਉਹ ਸਿਰਫ਼ ਅਗਲਾ ਟੋਕਨ ਭਵਿੱਖਬਾਣੀ ਹਨ।"
ਜਦੋਂ ਤੁਸੀਂ ਸਮਝ ਜਾਂਦੇ ਹੋ ਕਿ "ਅਗਲਾ ਟੋਕਨ ਭਵਿੱਖਬਾਣੀ" ਇਸ ਤਕਨਾਲੋਜੀ ਦਾ ਸਭ ਕੁਝ ਹੈ, ਤਾਂ ਬਹੁਤ ਸਾਰਾ ਹਾਈਪ ਗਾਇਬ ਹੋ ਜਾਂਦਾ ਹੈ। ਇਹ ਘੱਟ ਕਰਨਾ ਨਹੀਂ ਹੈ। ਇੱਕ ਮਾਈਕ੍ਰੋਵੇਵ ਓਵਨ ਪਾਣੀ ਦੇ ਅਣੂਆਂ ਨੂੰ ਗਰਮ ਕਰਦਾ ਹੈ, ਪਰ ਇਸਨੇ ਰਸੋਈ ਨੂੰ ਬਦਲ ਦਿੱਤਾ ਹੈ।
ਅਗਲਾ ਕਦਮ
LLM JPEG ਵਰਗੀ ਚੀਜ਼ ਬਣ ਜਾਵੇਗਾ: ਹਰ ਥਾਂ ਮੌਜੂਦ, ਕੋਈ ਵੀ ਇਸ ਬਾਰੇ ਗੱਲ ਨਹੀਂ ਕਰਦਾ, ਪਰ ਲਾਜ਼ਮੀ।
ਉਦੋਂ ਤੱਕ, ਸਮਝਦਾਰ ਲੋਕ ਕੀਮਤ ਯੁੱਧ ਵਿੱਚ ਸਭ ਤੋਂ ਸਸਤੇ ਸਪਲਾਇਰ ਦੀ ਚੋਣ ਕਰਨਗੇ। ਕਿਉਂਕਿ ਜਦੋਂ ਤਕਨਾਲੋਜੀ ਵਸਤੂ ਬਣ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਸਿਰਫ਼ ਲਾਗਤ ਹੀ ਮਹੱਤਵਪੂਰਨ ਹੁੰਦੀ ਹੈ।





