ਕਲਾਉਡ ਸੋਨੇਟ 4.6: ਮਾਡਲ ਪ੍ਰਦਰਸ਼ਨ ਦੀ ਘੱਟਦੀ ਸੀਮਾਂਤ
ਘੱਟਦੀ ਸੀਮਾਂਤ
ਇੱਕ "ਚੰਗਾ" ਮਾਡਲ ਅੱਪਗ੍ਰੇਡ ਕੀ ਹੁੰਦਾ ਹੈ?
ਜੇ ਤੁਸੀਂ ਆਮ ਲੋਕਾਂ ਨੂੰ ਪੁੱਛੋ, ਤਾਂ ਉਹ ਕਹਿਣਗੇ: ਵਧੇਰੇ ਸਮਾਰਟ। ਜੇ ਤੁਸੀਂ ਕਾਰੋਬਾਰਾਂ ਨੂੰ ਪੁੱਛੋ, ਤਾਂ ਉਹ ਕਹਿਣਗੇ: ਸਸਤਾ।
Sonnet 4.6 ਦੂਜੀ ਚੀਜ਼ ਕਰਦਾ ਹੈ।
"ਇਹ Opus-ਪੱਧਰ ਦੀ ਬੁੱਧੀ ਦੇ ਨੇੜੇ ਆਉਂਦਾ ਹੈ ਇੱਕ ਅਜਿਹੇ ਕੀਮਤ ਬਿੰਦੂ 'ਤੇ ਜੋ ਇਸਨੂੰ ਬਹੁਤ ਸਾਰੇ ਕੰਮਾਂ ਲਈ ਵਿਹਾਰਕ ਬਣਾਉਂਦਾ ਹੈ।" — @claudeai
ਇਹ ਤਕਨੀਕੀ ਸਫਲਤਾ ਨਹੀਂ ਹੈ। ਇਹ ਇੱਕ ਵਪਾਰਕ ਰਣਨੀਤੀ ਹੈ।
ਜਦੋਂ ਤਕਨੀਕੀ ਤਰੱਕੀ ਹੌਲੀ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਲਾਗਤ ਮੁਕਾਬਲੇ ਦਾ ਇੱਕ ਪਹਿਲੂ ਬਣ ਜਾਂਦੀ ਹੈ। ਇਹ ਅਸਫਲਤਾ ਨਹੀਂ ਹੈ, ਇਹ ਪਰਿਪੱਕਤਾ ਹੈ।
Sonnet 5 ਕਿਉਂ ਨਹੀਂ?
ਕੁਝ ਲੋਕ ਕਹਿੰਦੇ ਹਨ ਕਿ Anthropic ਦਾ ਅਸਲ ਵਿੱਚ ਇਸਨੂੰ Sonnet 5 ਕਹਿਣ ਦਾ ਇਰਾਦਾ ਸੀ।
"ਉਹਨਾਂ ਨੇ sonnet-5 ਦਾ ਨਾਮ ਬਦਲ ਕੇ 4.6 ਕਰ ਦਿੱਤਾ (ਕਾਰਨ ਸਧਾਰਨ ਹੈ - ਉਹ 5 ਨੂੰ ਇੱਕ ਵੱਡੀ ਛਾਲ ਲਈ ਬਚਾ ਰਹੇ ਹਨ)" — @chetaslua
ਇਹ ਨਾਮਕਰਨ ਆਪਣੇ ਆਪ ਵਿੱਚ ਇੱਕ ਸੰਕੇਤ ਹੈ। Anthropic ਜਾਣਦਾ ਹੈ ਕਿ ਇਹ ਇੱਕ ਵੱਡੀ ਛਾਲ ਨਹੀਂ ਹੈ।
ਜਦੋਂ ਕੋਈ ਕੰਪਨੀ ਸੰਸਕਰਣ ਨੰਬਰ ਨੂੰ 5 ਤੋਂ ਬਦਲ ਕੇ 4.6 ਕਰ ਦਿੰਦੀ ਹੈ, ਤਾਂ ਉਹ ਕਹਿ ਰਹੇ ਹਨ: ਇਹ ਇੱਕ ਵਾਧਾ ਅੱਪਡੇਟ ਹੈ, ਇੱਕ ਨਵਾਂ ਯੁੱਗ ਨਹੀਂ।
70% ਅਤੇ 59%
ਦੋ ਨੰਬਰ ਧਿਆਨ ਦੇਣ ਯੋਗ ਹਨ:
- 70%: Claude Code ਉਪਭੋਗਤਾ Sonnet 4.5 ਦੀ ਬਜਾਏ Sonnet 4.6 ਨੂੰ ਤਰਜੀਹ ਦਿੰਦੇ ਹਨ
- 59%: ਡਿਵੈਲਪਰਾਂ ਦਾ ਮੰਨਣਾ ਹੈ ਕਿ Sonnet 4.6, Opus 4.5 ਤੋਂ ਵਧੀਆ ਹੈ
ਇਹ ਦੋਵੇਂ ਨੰਬਰ ਇੱਕੋ ਗੱਲ ਦੱਸਦੇ ਹਨ: ਮੱਧ-ਰੇਂਜ ਮਾਡਲ ਉੱਚ-ਅੰਤ ਵਾਲੇ ਮਾਡਲਾਂ ਨੂੰ ਪਛਾੜ ਰਹੇ ਹਨ।

ਇਹ ਇਸ ਲਈ ਨਹੀਂ ਹੈ ਕਿਉਂਕਿ ਮੱਧ-ਰੇਂਜ ਬਿਹਤਰ ਹੋ ਗਿਆ ਹੈ, ਸਗੋਂ ਇਸ ਲਈ ਕਿਉਂਕਿ ਉੱਚ-ਅੰਤ ਤੋਂ ਸੀਮਾਂਤ ਲਾਭ ਘੱਟ ਰਹੇ ਹਨ।
1M ਸੰਦਰਭ
Sonnet 4.6 ਵਿੱਚ 1 ਮਿਲੀਅਨ ਟੋਕਨਾਂ ਦੀ ਸੰਦਰਭ ਵਿੰਡੋ ਹੈ (ਬੀਟਾ)।
ਪਰ ਕੀ ਇਹ ਉਹ ਹੈ ਜੋ ਉਪਭੋਗਤਾ ਚਾਹੁੰਦੇ ਹਨ?
"ਜ਼ਿਆਦਾਤਰ ਬਿਲਡਰ Claude Sonnet 4.6 ਦੀ ਗਲਤ ਵਰਤੋਂ ਕਰਨਗੇ। ਉਹ ਹਰ ਚੀਜ਼ ਲਈ 1M ਸੰਦਰਭ ਨੂੰ ਚਾਲੂ ਕਰਨਗੇ। ਫਿਰ ਲਾਗਤ ਬਾਰੇ ਸ਼ਿਕਾਇਤ ਕਰਨਗੇ। 200K + ਪ੍ਰੋਂਪਟ ਕੈਸ਼ਿੰਗ 'ਤੇ Sonnet 4.6, 90% ਵਰਕਫਲੋ ਲਈ ਜ਼ਿਆਦਾਤਰ ਅਧਿਕਤਮ ਸੰਦਰਭ ਸੈੱਟਅੱਪਾਂ ਤੋਂ ਬਿਹਤਰ ਪ੍ਰਦਰਸ਼ਨ ਕਰੇਗਾ।" — @EarthExcursions
ਵੱਡਾ ਸੰਦਰਭ ਬਿਹਤਰ ਨਤੀਜਿਆਂ ਦੇ ਬਰਾਬਰ ਨਹੀਂ ਹੈ। ਜ਼ਿਆਦਾਤਰ ਮਾਮਲਿਆਂ ਵਿੱਚ, ਇਹ ਸਿਰਫ਼ ਇੱਕ ਉੱਚਾ ਬਿੱਲ ਹੈ।
GitHub Copilot ਏਕੀਕਰਣ
Sonnet 4.6 ਪਹਿਲਾਂ ਹੀ GitHub Copilot 'ਤੇ ਲਾਈਵ ਹੋ ਚੁੱਕਾ ਹੈ।
"Claude Sonnet 4.6 ਹੁਣ ਆਮ ਤੌਰ 'ਤੇ ਉਪਲਬਧ ਹੈ ਅਤੇ GitHub Copilot ਵਿੱਚ ਰੋਲ ਆਊਟ ਹੋ ਰਿਹਾ ਹੈ।" — @github
ਇਹ ਕੀ ਦਰਸਾਉਂਦਾ ਹੈ? ਡਿਵੈਲਪਰ ਟੂਲ AI ਮਾਡਲਾਂ ਲਈ ਪਹਿਲਾ ਜੰਗੀ ਮੈਦਾਨ ਬਣ ਰਹੇ ਹਨ।
OpenAI ਕੋਲ Cursor ਹੈ। Anthropic ਕੋਲ Copilot ਹੈ। Google ਨੇ ਅਜੇ ਸੋਚਿਆ ਨਹੀਂ ਹੈ।
ਇਹ ਇਸ ਬਾਰੇ ਨਹੀਂ ਹੈ ਕਿ ਕਿਸਦਾ ਮਾਡਲ ਜ਼ਿਆਦਾ ਸਮਾਰਟ ਹੈ। ਇਹ ਇਸ ਬਾਰੇ ਹੈ ਕਿ ਡਿਵੈਲਪਰ ਹਰ ਰੋਜ਼ ਜੋ ਪਹਿਲੀ ਵਿੰਡੋ ਖੋਲ੍ਹਦੇ ਹਨ, ਉਸ ਵਿੱਚ ਕੌਣ ਹੈ।
ਕੀਮਤ ਯੁੱਧ ਸ਼ੁਰੂ ਹੋ ਗਿਆ ਹੈ
Sonnet 4.6 ਦੀ ਸਭ ਤੋਂ ਮਹੱਤਵਪੂਰਨ ਵਿਸ਼ੇਸ਼ਤਾ ਮਾਡਲ ਵਿੱਚ ਨਹੀਂ ਹੈ, ਕੀਮਤ ਵਿੱਚ ਹੈ।
"Claude Sonnet 4.6 ਬਹੁਤ ਵਧੀਆ ਪ੍ਰਦਰਸ਼ਨ ਕਰਦਾ ਹੈ ਅਤੇ Claude Opus 4.6 ਦੇ ਬਰਾਬਰ ਹੈ ਜਦੋਂ ਕਿ ਲਗਭਗ 50% ਸਸਤਾ ਹੈ" — @bridgemindai
ਇਹ AI ਉਦਯੋਗ ਦੇ ਪਰਿਪੱਕਤਾ ਵਿੱਚ ਦਾਖਲ ਹੋਣ ਦਾ ਸੰਕੇਤ ਹੈ।
ਜਦੋਂ ਉਤਪਾਦ ਵਿਭਿੰਨਤਾ ਛੋਟੀ ਹੋ ਜਾਂਦੀ ਹੈ, ਤਾਂ ਕੀਮਤ ਮੁਕਾਬਲਾ ਸ਼ੁਰੂ ਹੋ ਜਾਂਦਾ ਹੈ। ਜਦੋਂ ਕੀਮਤ ਮੁਕਾਬਲਾ ਸ਼ੁਰੂ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਲਾਭਅੰਸ਼ ਘੱਟ ਜਾਂਦਾ ਹੈ। ਜਦੋਂ ਲਾਭਅੰਸ਼ ਘੱਟ ਜਾਂਦਾ ਹੈ, ਤਾਂ ਸਿਰਫ਼ ਵੱਡੇ ਖਿਡਾਰੀ ਹੀ ਬਚ ਸਕਦੇ ਹਨ।
Anthropic ਜੋ ਕਰ ਰਿਹਾ ਹੈ ਉਹ ਹੈ: ਕੀਮਤ ਨਾਲ ਮਾਰਕੀਟ ਹਿੱਸੇਦਾਰੀ ਦਾ ਵਪਾਰ ਕਰਨਾ।
ਕੀ ਕੋਈ ਅਜੇ ਵੀ ChatGPT ਦੀ ਵਰਤੋਂ ਕਰਦਾ ਹੈ?
ਇੱਕ ਪੋਲਿਸ਼ ਉਪਭੋਗਤਾ ਦਾ ਟਵੀਟ:
"Claude Sonnet 4.6 ਹੁਣੇ ਜਾਰੀ ਹੋਇਆ ਹੈ। ਅਤੇ ਇਮਾਨਦਾਰੀ ਨਾਲ? ਮੈਨੂੰ ਨਹੀਂ ਪਤਾ ਕਿ ਕੋਈ ਅਜੇ ਵੀ ChatGPT ਦੀ ਵਰਤੋਂ ਕਿਉਂ ਕਰੇਗਾ।" — @nauczymycieAI
ਇਹ ਇੱਕ ਅਸਲੀ ਉਪਭੋਗਤਾ ਦੀ ਭਾਵਨਾ ਹੈ। ਕੋਈ ਤਕਨੀਕੀ ਸਮੀਖਿਆ ਨਹੀਂ, ਕੋਈ ਬੈਂਚਮਾਰਕ ਟੈਸਟ ਨਹੀਂ, ਸਿਰਫ਼ ਭਾਵਨਾ।
ਭਾਵਨਾ ਮਹੱਤਵਪੂਰਨ ਹੈ। ਜਦੋਂ ਦੋ ਉਤਪਾਦਾਂ ਦੇ ਕਾਰਜ ਸਮਾਨ ਹੁੰਦੇ ਹਨ, ਤਾਂ ਉਪਭੋਗਤਾ ਉਸਨੂੰ ਚੁਣਦੇ ਹਨ ਜੋ "ਵਧੀਆ ਮਹਿਸੂਸ ਕਰਦਾ ਹੈ"।
ਟਰਮੀਨਲ ਨਵਾਂ IDE ਹੈ
GitHub ਦੇ Copilot CLI ਏਕੀਕਰਣ ਇੱਕ ਰੁਝਾਨ ਨੂੰ ਦਰਸਾਉਂਦਾ ਹੈ:
ਕੋਡ IDE ਤੋਂ ਟਰਮੀਨਲ ਵਿੱਚ ਲਿਖਿਆ ਜਾ ਰਿਹਾ ਹੈ।
"VS Code ਜਾਂ Copilot CLI ਵਿੱਚ ਇਸਨੂੰ ਅਜ਼ਮਾਓ।" — @github
ਇਹ ਕੋਈ ਤਕਨੀਕੀ ਵੇਰਵਾ ਨਹੀਂ ਹੈ। ਇਹ ਡਿਵੈਲਪਰ ਵਰਕਫਲੋ ਵਿੱਚ ਇੱਕ ਬੁਨਿਆਦੀ ਤਬਦੀਲੀ ਹੈ।
ਜਦੋਂ ਤੁਸੀਂ ਟਰਮੀਨਲ ਵਿੱਚ ਇੱਕ ਕਮਾਂਡ ਟਾਈਪ ਕਰਦੇ ਹੋ, ਤਾਂ AI ਤੁਹਾਡੇ ਲਈ ਇਸਨੂੰ ਪੂਰਾ ਕਰਦਾ ਹੈ। ਇਹ "ਸਹਾਇਕ ਪ੍ਰੋਗਰਾਮਿੰਗ" ਨਹੀਂ ਹੈ। ਇਹ "ਗੱਲਬਾਤ ਵਾਲੀ ਪ੍ਰੋਗਰਾਮਿੰਗ" ਹੈ।
ਹੇਠਲੀ ਲਾਈਨ
Sonnet 4.6 ਕੋਈ ਕ੍ਰਾਂਤੀ ਨਹੀਂ ਹੈ।
ਇਹ AI ਮਾਡਲਾਂ ਦੇ ਇੱਕ ਵਸਤੂਕਰਨ ਵੱਲ ਜਾਣ ਦਾ ਇੱਕ ਹੋਰ ਸਬੂਤ ਹੈ।
ਜਦੋਂ ਪ੍ਰਦਰਸ਼ਨ ਵਿੱਚ ਅੰਤਰ ਇੰਨਾ ਛੋਟਾ ਹੁੰਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਸਮਝਣਾ ਮੁਸ਼ਕਲ ਹੁੰਦਾ ਹੈ, ਅਤੇ ਕੀਮਤ ਵਿੱਚ ਅੰਤਰ ਇੰਨਾ ਵੱਡਾ ਹੁੰਦਾ ਹੈ ਕਿ ਇਸਨੂੰ ਨਜ਼ਰਅੰਦਾਜ਼ ਕਰਨਾ ਮੁਸ਼ਕਲ ਹੁੰਦਾ ਹੈ, ਤਾਂ ਤੁਸੀਂ ਜਾਣਦੇ ਹੋ ਕਿ ਇਹ ਉਦਯੋਗ ਪਰਿਪੱਕ ਹੋ ਰਿਹਾ ਹੈ।
ਇਹ ਕੋਈ ਮਾੜੀ ਗੱਲ ਨਹੀਂ ਹੈ। ਪਰਿਪੱਕਤਾ ਦਾ ਮਤਲਬ ਹੈ ਸਥਿਰਤਾ। ਸਥਿਰਤਾ ਦਾ ਮਤਲਬ ਹੈ ਅਨੁਮਾਨ ਲਗਾਉਣ ਯੋਗ। ਅਨੁਮਾਨ ਲਗਾਉਣ ਯੋਗ ਦਾ ਮਤਲਬ ਹੈ ਕਿ ਇਸ 'ਤੇ ਬਣਾਇਆ ਜਾ ਸਕਦਾ ਹੈ।
ਅਗਲੀ ਲਹਿਰ ਦੀ ਨਵੀਨਤਾ "ਵਧੇਰੇ ਸਮਾਰਟ ਮਾਡਲਾਂ" ਤੋਂ ਨਹੀਂ ਆਵੇਗੀ। ਇਹ "ਸਸਤੀ ਬੁੱਧੀ" ਤੋਂ ਆਵੇਗੀ।





