GPT ਦੀ ਲਾਗਤ ਦੀ ਕੰਧ

ਪਿਛਲੇ ਹਫ਼ਤੇ, X 'ਤੇ GPT ਬਾਰੇ ਚਰਚਾ ਦਾ ਇੱਕ ਨਵਾਂ ਕੇਂਦਰ ਬਣਿਆ: ਸਮਰੱਥਾ ਨਹੀਂ, ਸਗੋਂ ਲਾਗਤ।

ARC-AGI: ਬੁੱਧੀ ਦੀ ਸੀਮਾ

ਵਰਤਮਾਨ ਵਿੱਚ ਸਭ ਤੋਂ ਅਤਿ-ਆਧੁਨਿਕ ਮਾਡਲ ARC-AGI-2 'ਤੇ ਕਿਵੇਂ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦੇ ਹਨ:

ਮਾਡਲ	ARC-AGI-2 ਸਕੋਰ
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
ਮਨੁੱਖ	100%

54% ਤੋਂ 73% ਵਿਚਕਾਰ ਅੰਤਰ ਬੁੱਧੀ ਦਾ ਮਸਲਾ ਨਹੀਂ ਹੈ, ਇਹ "ਰਿਫਾਈਨਮੈਂਟ" ਹੈ - ਮਾਡਲ ਨੂੰ ਆਪਣੇ ਜਵਾਬਾਂ ਦੀ ਵਾਰ-ਵਾਰ ਜਾਂਚ ਕਰਨ ਲਈ ਕਹਿਣਾ। ਇਸ ਲਈ ਵਧੇਰੇ ਗਣਨਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਜਿਸਦਾ ਮਤਲਬ ਹੈ ਵੱਧ ਲਾਗਤ।

ਏਜੰਟ ਦੀ ਅਸਲ ਲਾਗਤ

24/7 ਐਂਟਰਪ੍ਰਾਈਜ਼-ਪੱਧਰ ਦੇ ਏਜੰਟ (ਪ੍ਰਤੀ ਦਿਨ 20 ਮਿਲੀਅਨ ਇਨਪੁਟ + 20 ਮਿਲੀਅਨ ਆਉਟਪੁੱਟ ਟੋਕਨ) ਦੀ ਸਾਲਾਨਾ ਲਾਗਤ:

ਮਾਡਲ	ਸਾਲਾਨਾ ਲਾਗਤ
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro, GPT-5.2 Standard ਨਾਲੋਂ 12 ਗੁਣਾ ਮਹਿੰਗਾ ਹੈ। ਇਹ ਕੀਮਤ ਨਿਰਧਾਰਨ ਦੀ ਸਮੱਸਿਆ ਨਹੀਂ ਹੈ, ਇਹ ਲਾਗਤ ਢਾਂਚੇ ਦੀ ਸਮੱਸਿਆ ਹੈ।

"100 AI ਏਜੰਟ ਤਾਇਨਾਤ ਕਰਨ ਤੋਂ ਪਹਿਲਾਂ, ਗਣਿਤ ਚਲਾਓ।" — @waseem_s

ਨਵਾਂ ਟਿਊਰਿੰਗ ਟੈਸਟ

ਇੱਕ ਸਧਾਰਨ ਸਵਾਲ ਨਵੀਂ ਬੁੱਧੀ ਜਾਂਚ ਬਣ ਰਿਹਾ ਹੈ:

"ਕਾਰ ਧੋਣ ਦੀ ਦੁਕਾਨ ਮੇਰੇ ਘਰ ਤੋਂ 40 ਮੀਟਰ ਦੂਰ ਹੈ। ਮੈਂ ਆਪਣੀ ਕਾਰ ਧੋਣਾ ਚਾਹੁੰਦਾ ਹਾਂ। ਕੀ ਮੈਨੂੰ ਪੈਦਲ ਜਾਣਾ ਚਾਹੀਦਾ ਹੈ ਜਾਂ ਗੱਡੀ ਚਲਾਉਣੀ ਚਾਹੀਦੀ ਹੈ?"

ਪਾਸ ਕੀਤੇ ਮਾਡਲ: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro ਫੇਲ੍ਹ ਹੋਏ ਮਾਡਲ: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

ਇਹ ਟੈਸਟ ਕਿਉਂ ਮਹੱਤਵਪੂਰਨ ਹੈ? ਕਿਉਂਕਿ ਇਹ "ਆਮ ਸਮਝ ਤਰਕ" ਦੀ ਜਾਂਚ ਕਰਦਾ ਹੈ ਨਾ ਕਿ "ਗਿਆਨ ਪ੍ਰਾਪਤੀ" ਦੀ। 40 ਮੀਟਰ ਪੈਦਲ ਦੂਰੀ ਹੈ। ਕਾਰ ਗੰਦੀ ਹੈ ਅਤੇ ਧੋਣ ਦੀ ਲੋੜ ਹੈ। ਪਰ ਤੁਸੀਂ ਗੰਦੀ ਕਾਰ ਨੂੰ 40 ਮੀਟਰ ਤੱਕ ਧੋਣ ਲਈ ਨਹੀਂ ਚਲਾਓਗੇ - ਜਦੋਂ ਤੱਕ ਤੁਹਾਨੂੰ ਆਮ ਸਮਝ ਨਹੀਂ ਹੈ।

ਇਤਿਹਾਸ ਆਪਣੇ ਆਪ ਨੂੰ ਨਹੀਂ ਦੁਹਰਾਉਂਦਾ, ਪਰ ਇਹ ਤੁਕਾਂਤ ਕਰਦਾ ਹੈ

"ਮਾਹਰ ਸਿਸਟਮ 1970 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਪੈਦਾ ਹੋਏ, 1980 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਵਧੇ, ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ AI ਦਾ ਭਵਿੱਖ ਮੰਨੇ ਜਾਂਦੇ ਸਨ।" — @ChombaBupe

GPT ਮਾਡਲ 2018 ਵਿੱਚ ਪੈਦਾ ਹੋਏ, 2020 ਦੇ ਦਹਾਕੇ ਵਿੱਚ ਵਧੇ, ਅਤੇ ਵਿਆਪਕ ਤੌਰ 'ਤੇ AI ਦਾ ਭਵਿੱਖ ਮੰਨੇ ਜਾਂਦੇ ਸਨ।

ਮਾਹਰ ਸਿਸਟਮਾਂ ਦੀ ਅਸਫਲਤਾ ਇਸ ਲਈ ਨਹੀਂ ਸੀ ਕਿਉਂਕਿ ਉਹ ਇੰਨੇ ਸਮਾਰਟ ਨਹੀਂ ਸਨ, ਸਗੋਂ ਇਸ ਲਈ ਕਿਉਂਕਿ ਰੱਖ-ਰਖਾਅ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਸੀ ਅਤੇ ਵਿਸਤਾਰਯੋਗਤਾ ਬਹੁਤ ਮਾੜੀ ਸੀ। ਜਦੋਂ ਗਿਆਨ ਅਧਾਰ ਨੂੰ ਹੱਥੀਂ ਬਣਾਈ ਰੱਖਣ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਪੈਮਾਨਾ ਦੁਸ਼ਮਣ ਹੁੰਦਾ ਹੈ।

GPT ਇੱਕ ਮਿਰਰ ਸਮੱਸਿਆ ਦਾ ਸਾਹਮਣਾ ਕਰ ਰਿਹਾ ਹੈ: ਮਾਡਲ ਸਮਾਰਟ ਹਨ, ਪਰ ਤਰਕ ਦੀ ਲਾਗਤ ਬਹੁਤ ਜ਼ਿਆਦਾ ਹੈ। ਜਦੋਂ ਹਰੇਕ ਬੇਨਤੀ ਲਈ ਬਹੁਤ ਸਾਰੀ ਗਣਨਾ ਦੀ ਲੋੜ ਹੁੰਦੀ ਹੈ, ਤਾਂ ਪੈਮਾਨਾ ਵੀ ਦੁਸ਼ਮਣ ਹੁੰਦਾ ਹੈ।

ਅਗਲਾ ਕਦਮ

ਇਸ ਹਫ਼ਤੇ ਕਈ ਨਵੇਂ ਮਾਡਲਾਂ ਦੇ ਜਾਰੀ ਹੋਣ ਦੀ ਉਮੀਦ ਹੈ: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5।

ਮੁਕਾਬਲਾ "ਕੌਣ ਜ਼ਿਆਦਾ ਸਮਾਰਟ ਹੈ" ਤੋਂ "ਕੌਣ ਸਸਤਾ ਹੈ" ਵੱਲ ਬਦਲ ਰਿਹਾ ਹੈ। ਇਹ ਉਪਭੋਗਤਾਵਾਂ ਲਈ ਚੰਗੀ ਖ਼ਬਰ ਹੈ। OpenAI ਲਈ? ਜ਼ਰੂਰੀ ਨਹੀਂ।

GPT ਦੀ ਲਾਗਤ ਦੀ ਕੰਧ

ARC-AGI: ਬੁੱਧੀ ਦੀ ਸੀਮਾ

ਏਜੰਟ ਦੀ ਅਸਲ ਲਾਗਤ

ਨਵਾਂ ਟਿਊਰਿੰਗ ਟੈਸਟ

ਇਤਿਹਾਸ ਆਪਣੇ ਆਪ ਨੂੰ ਨਹੀਂ ਦੁਹਰਾਉਂਦਾ, ਪਰ ਇਹ ਤੁਕਾਂਤ ਕਰਦਾ ਹੈ

ਅਗਲਾ ਕਦਮ

You Might Also Like

Claude Code Buddy ਸੋਧ ਗਾਈਡ: ਕਿਵੇਂ ਚਮਕਦਾਰ ਪੁਰਾਣੀ ਪਾਲਤੂ ਪ੍ਰਾਪਤ ਕਰੀਏ

Obsidian ਨੇ Defuddle ਜਾਰੀ ਕੀਤਾ, Obsidian Web Clipper ਨੂੰ ਇੱਕ ਨਵੇਂ ਉੱਚਾਈ 'ਤੇ ਲੈ ਗਿਆ

OpenAI اچانک "تین میں ایک" کا اعلان کرتا ہے: براؤزر + پروگرامنگ + ChatGPT کا انضمام، اندرونی طور پر تسلیم کیا کہ پچھلے سال غلط راستہ اختیار کیا گیا

2026, ਆਪਣੇ ਆਪ ਨੂੰ "ਆਤਮ-ਨਿਯੰਤਰਣ" ਕਰਨ ਲਈ ਦਬਾਉ ਨਾ ਦਿਓ! ਇਹ 8 ਛੋਟੇ ਕੰਮ ਕਰੋ, ਸਿਹਤ ਆਪ ਹੀ ਆਏਗੀ

ਉਹ ਮਾਂਵਾਂ ਜੋ ਵਜ਼ਨ ਘਟਾਉਣ ਲਈ ਕੋਸ਼ਿਸ਼ ਕਰਦੀਆਂ ਹਨ, ਪਰ ਫਿਰ ਵੀ ਘਟ ਨਹੀਂ ਪਾਉਂਦੀਆਂ, ਇਹਨਾਂ ਨੂੰ ਇੱਥੇ ਹੀ ਫਸਣਾ ਪੈਂਦਾ ਹੈ

AI Browser 24 ਘੰਟੇ ਸਥਿਰ ਚਾਲੂ ਰੱਖਣ ਦੀ ਗਾਈਡ