GPT ਦੀ ਲਾਗਤ ਦੀ ਕੰਧ
ਪਿਛਲੇ ਹਫ਼ਤੇ, X 'ਤੇ GPT ਬਾਰੇ ਚਰਚਾ ਦਾ ਇੱਕ ਨਵਾਂ ਕੇਂਦਰ ਬਣਿਆ: ਸਮਰੱਥਾ ਨਹੀਂ, ਸਗੋਂ ਲਾਗਤ।
ARC-AGI: ਬੁੱਧੀ ਦੀ ਸੀਮਾ
ਵਰਤਮਾਨ ਵਿੱਚ ਸਭ ਤੋਂ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ARC-AGI-2 'ਤੇ ਕਿਵੇਂ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ:
| ਮਾਡਲ | ARC-AGI-2 ਸਕੋਰ |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| ਮਨੁੱਖ | 100% |
54% ਤੋਂ 73% ਵਿਚਕਾਰ ਅੰਤਰ ਬੁੱਧੀ ਦਾ ਮਸਲਾ ਨਹੀਂ ਹੈ, ਇਹ "ਰਿਫਾਈਨਮੈਂਟ" ਹੈ - ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਜਵਾਬਾਂ ਦੀ ਵਾਰ-ਵਾਰ ਜਾਂਚ ਕਰਨ ਲਈ ਕਹਿਣਾ। ਇਸ ਲਈ ਵਧੇਰੇ ਗਣਨਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਸਦਾ ਮਤਲਬ ਹੈ ਵੱਧ ਲਾਗਤ।
ਏਜੰਟ ਦੀ ਅਸਲ ਲਾਗਤ
24/7 ਐਂਟਰਪ੍ਰਾਈਜ਼-ਪੱਧਰ ਦੇ ਏਜੰਟ (ਪ੍ਰਤੀ ਦਿਨ 20 ਮਿਲੀਅਨ ਇਨਪੁਟ + 20 ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ) ਦੀ ਸਾਲਾਨਾ ਲਾਗਤ:
| ਮਾਡਲ | ਸਾਲਾਨਾ ਲਾਗਤ |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
GPT-5.2 Pro, GPT-5.2 Standard ਨਾਲੋਂ 12 ਗੁਣਾ ਮਹਿੰਗਾ ਹੈ। ਇਹ ਕੀਮਤ ਨਿਰਧਾਰਨ ਦੀ ਸਮੱਸਿਆ ਨਹੀਂ ਹੈ, ਇਹ ਲਾਗਤ ਢਾਂਚੇ ਦੀ ਸਮੱਸਿਆ ਹੈ।
"100 AI ਏਜੰਟ ਤਾਇਨਾਤ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਗਣਿਤ ਚਲਾਓ।" — @waseem_s
ਨਵਾਂ ਟਿਊਰਿੰਗ ਟੈਸਟ
ਇੱਕ ਸਧਾਰਨ ਸਵਾਲ ਨਵੀਂ ਬੁੱਧੀ ਜਾਂਚ ਬਣ ਰਿਹਾ ਹੈ:
"ਕਾਰ ਧੋਣ ਦੀ ਦੁਕਾਨ ਮੇਰੇ ਘਰ ਤੋਂ 40 ਮੀਟਰ ਦੂਰ ਹੈ। ਮੈਂ ਆਪਣੀ ਕਾਰ ਧੋਣਾ ਚਾਹੁੰਦਾ ਹਾਂ। ਕੀ ਮੈਨੂੰ ਪੈਦਲ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਜਾਂ ਗੱਡੀ ਚਲਾਉਣੀ ਚਾਹੀਦੀ ਹੈ?"
ਪਾਸ ਕੀਤੇ ਮਾਡਲ: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro ਫੇਲ੍ਹ ਹੋਏ ਮਾਡਲ: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
ਇਹ ਟੈਸਟ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ? ਕਿਉਂਕਿ ਇਹ "ਆਮ ਸਮਝ ਤਰਕ" ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ ਨਾ ਕਿ "ਗਿਆਨ ਪ੍ਰਾਪਤੀ" ਦੀ। 40 ਮੀਟਰ ਪੈਦਲ ਦੂਰੀ ਹੈ। ਕਾਰ ਗੰਦੀ ਹੈ ਅਤੇ ਧੋਣ ਦੀ ਲੋੜ ਹੈ। ਪਰ ਤੁਸੀਂ ਗੰਦੀ ਕਾਰ ਨੂੰ 40 ਮੀਟਰ ਤੱਕ ਧੋਣ ਲਈ ਨਹੀਂ ਚਲਾਓਗੇ - ਜਦੋਂ ਤੱਕ ਤੁਹਾਨੂੰ ਆਮ ਸਮਝ ਨਹੀਂ ਹੈ।
ਇਤਿਹਾਸ ਆਪਣੇ ਆਪ ਨੂੰ ਨਹੀਂ ਦੁਹਰਾਉਂਦਾ, ਪਰ ਇਹ ਤੁਕਾਂਤ ਕਰਦਾ ਹੈ
"ਮਾਹਰ ਸਿਸਟਮ 1970 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਪੈਦਾ ਹੋਏ, 1980 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਵਧੇ, ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ AI ਦਾ ਭਵਿੱਖ ਮੰਨੇ ਜਾਂਦੇ ਸਨ।" — @ChombaBupe
GPT ਮਾਡਲ 2018 ਵਿੱਚ ਪੈਦਾ ਹੋਏ, 2020 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਵਧੇ, ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ AI ਦਾ ਭਵਿੱਖ ਮੰਨੇ ਜਾਂਦੇ ਸਨ।
ਮਾਹਰ ਸਿਸਟਮਾਂ ਦੀ ਅਸਫਲਤਾ ਇਸ ਲਈ ਨਹੀਂ ਸੀ ਕਿਉਂਕਿ ਉਹ ਇੰਨੇ ਸਮਾਰਟ ਨਹੀਂ ਸਨ, ਸਗੋਂ ਇਸ ਲਈ ਕਿਉਂਕਿ ਰੱਖ-ਰਖਾਅ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸੀ ਅਤੇ ਵਿਸਤਾਰਯੋਗਤਾ ਬਹੁਤ ਮਾੜੀ ਸੀ। ਜਦੋਂ ਗਿਆਨ ਅਧਾਰ ਨੂੰ ਹੱਥੀਂ ਬਣਾਈ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਪੈਮਾਨਾ ਦੁਸ਼ਮਣ ਹੁੰਦਾ ਹੈ।
GPT ਇੱਕ ਮਿਰਰ ਸਮੱਸਿਆ ਦਾ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ: ਮਾਡਲ ਸਮਾਰਟ ਹਨ, ਪਰ ਤਰਕ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ। ਜਦੋਂ ਹਰੇਕ ਬੇਨਤੀ ਲਈ ਬਹੁਤ ਸਾਰੀ ਗਣਨਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਪੈਮਾਨਾ ਵੀ ਦੁਸ਼ਮਣ ਹੁੰਦਾ ਹੈ।
ਅਗਲਾ ਕਦਮ
ਇਸ ਹਫ਼ਤੇ ਕਈ ਨਵੇਂ ਮਾਡਲਾਂ ਦੇ ਜਾਰੀ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5।
ਮੁਕਾਬਲਾ "ਕੌਣ ਜ਼ਿਆਦਾ ਸਮਾਰਟ ਹੈ" ਤੋਂ "ਕੌਣ ਸਸਤਾ ਹੈ" ਵੱਲ ਬਦਲ ਰਿਹਾ ਹੈ। ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਚੰਗੀ ਖ਼ਬਰ ਹੈ। OpenAI ਲਈ? ਜ਼ਰੂਰੀ ਨਹੀਂ।





