Claude Sonnet 4.6: மாதிரி செயல்திறனின் விளிம்புநிலை குறைவு
விளிம்புநிலை குறைவு
ஒரு "நல்ல" மாதிரி மேம்பாடு என்றால் என்ன?
நீங்கள் சாதாரண மனிதரிடம் கேட்டால், அவர்கள் சொல்வார்கள்: புத்திசாலித்தனமானது. நீங்கள் நிறுவனத்திடம் கேட்டால், அவர்கள் சொல்வார்கள்: மலிவானது.
Sonnet 4.6 இரண்டாவது விஷயத்தைச் செய்கிறது.
"இது Opus-நிலை நுண்ணறிவை ஒரு விலையில் அணுகுகிறது, இது அதிகமான பணிகளுக்கு நடைமுறைக்கு ஏற்றதாக ஆக்குகிறது." — @claudeai
இது தொழில்நுட்ப முன்னேற்றம் அல்ல. இது வணிக உத்தி.
தொழில்நுட்ப முன்னேற்றம் குறையும்போது, செலவு ஒரு போட்டி பரிமாணமாக மாறும். இது தோல்வி அல்ல, முதிர்ச்சி.
ஏன் Sonnet 5 அல்ல?
Anthropic முதலில் அதை Sonnet 5 என்று அழைக்க திட்டமிட்டதாக சிலர் கூறுகிறார்கள்.
"அவர்கள் sonnet-5 ஐ 4.6 என மறுபெயரிட்டனர் (காரணம் எளிதானது - அவர்கள் 5 ஐ ஒரு பெரிய முன்னேற்றத்திற்காக சேமிக்கிறார்கள்)" — @chetaslua
இந்த பெயரிடல் ஒரு சமிக்ஞை. இது ஒரு பெரிய முன்னேற்றம் அல்ல என்று Anthropic க்கு தெரியும்.
ஒரு நிறுவனம் பதிப்பு எண்ணை 5 இலிருந்து 4.6 ஆக மாற்றும்போது, அவர்கள் சொல்வது: இது ஒரு அதிகரிப்பு புதுப்பிப்பு, ஒரு புதிய சகாப்தம் அல்ல.
70% மற்றும் 59%
இரண்டு எண்கள் குறிப்பிடத்தக்கவை:
- 70%: Claude Code பயனர்கள் Sonnet 4.5 ஐ விட Sonnet 4.6 ஐ விரும்புகிறார்கள்
- 59%: டெவலப்பர்கள் Sonnet 4.6 Opus 4.5 ஐ விட சிறந்தது என்று நினைக்கிறார்கள்
இந்த இரண்டு எண்களும் ஒரே விஷயத்தைக் கூறுகின்றன: நடுத்தர மாதிரி உயர்நிலை மாதிரியை நெருங்குகிறது.

நடுத்தரமானது சிறப்பாக இருப்பதால் அல்ல, ஆனால் உயர்நிலையின் விளிம்பு வருவாய் குறைந்து வருவதால் இது நிகழ்கிறது.
1M சூழல்
Sonnet 4.6 இல் 1 மில்லியன் டோக்கன்களின் சூழல் சாளரம் உள்ளது (பீட்டா).
ஆனால் இது பயனர்கள் விரும்புவதா?
"பெரும்பாலான கட்டமைப்பாளர்கள் Claude Sonnet 4.6 ஐ தவறாகப் பயன்படுத்துவார்கள். அவர்கள் எல்லாவற்றிற்கும் 1M சூழலை இயக்குவார்கள். பின்னர் செலவைப் பற்றி புகார் செய்வார்கள். 200K + prompt caching இல் Sonnet 4.6 பெரும்பாலான அதிகபட்ச சூழல் அமைப்புகளை 90% பணிப்பாய்வுகளுக்கு மிஞ்சும்." — @EarthExcursions
பெரிய சூழல் சிறந்த முடிவுகளுக்கு சமம் அல்ல. பெரும்பாலான சந்தர்ப்பங்களில், இது அதிக கட்டணம் மட்டுமே.
GitHub Copilot ஒருங்கிணைப்பு
Sonnet 4.6 ஏற்கனவே GitHub Copilot இல் நேரலையில் உள்ளது.
"Claude Sonnet 4.6 இப்போது பொதுவாகக் கிடைக்கிறது மற்றும் GitHub Copilot இல் வெளியிடப்படுகிறது." — @github
இது எதைக் காட்டுகிறது? டெவலப்பர் கருவிகள் AI மாதிரிகளின் முதல் போர்க்களமாக மாறி வருகின்றன.
OpenAI இல் Cursor உள்ளது. Anthropic இல் Copilot உள்ளது. Google இன்னும் தெளிவாக சிந்திக்கவில்லை.
இது யாருடைய மாதிரி புத்திசாலித்தனமானது என்பது பற்றியது அல்ல. டெவலப்பர்கள் தினமும் திறக்கும் முதல் சாளரத்தில் யார் இருக்கிறார்கள் என்பது பற்றியது.
விலை போர் ஏற்கனவே தொடங்கிவிட்டது
Sonnet 4.6 இன் மிக முக்கியமான அம்சம் மாதிரியில் இல்லை, விலையில் உள்ளது.
"Claude Sonnet 4.6 நம்பமுடியாத அளவிற்கு சிறப்பாக செயல்படுகிறது மற்றும் Claude Opus 4.6 க்கு இணையாக உள்ளது, அதே நேரத்தில் கிட்டத்தட்ட 50% மலிவானது" — @bridgemindai
இது AI தொழில் முதிர்ச்சியடையும் அடையாளமாகும்.
தயாரிப்பு வேறுபாடு சிறியதாகும்போது, விலை போட்டி தொடங்குகிறது. விலை போட்டி தொடங்கும்போது, லாப வரம்பு குறைகிறது. லாப வரம்பு குறையும்போது, பெரிய அளவிலான வீரர்கள் மட்டுமே உயிர் பிழைக்க முடியும்.
Anthropic செய்வது: விலையுடன் சந்தைப் பங்கை மாற்றுகிறது.
இன்னும் ChatGPT ஐ யாராவது பயன்படுத்துகிறார்களா?
ஒரு போலந்து பயனரின் ட்வீட்:
"Claude Sonnet 4.6 இப்போது வெளிவந்துள்ளது. நேர்மையாக? ChatGPT ஐ இன்னும் ஏன் யாராவது பயன்படுத்துவார்கள் என்று எனக்குத் தெரியவில்லை." — @nauczymycieAI
இது ஒரு உண்மையான பயனர் உணர்வு. தொழில்நுட்ப மதிப்பாய்வு அல்ல, தரப்படுத்தல் சோதனை அல்ல, உணர்வு மட்டுமே.
உணர்வு முக்கியமானது. இரண்டு தயாரிப்புகள் ஒத்த செயல்பாடுகளைக் கொண்டிருக்கும்போது, பயனர்கள் "சிறப்பாக உணரும்" ஒன்றைத் தேர்ந்தெடுப்பார்கள்.
டெர்மினல் புதிய IDE
GitHub இன் Copilot CLI ஒருங்கிணைப்பு ஒரு போக்கைக் காட்டுகிறது:
குறியீடு IDE இலிருந்து டெர்மினலுக்கு எழுதப்படுகிறது.
"VS Code அல்லது Copilot CLI இல் முயற்சிக்கவும்." — @github
இது ஒரு தொழில்நுட்ப விவரம் அல்ல. இது டெவலப்பர் பணிப்பாய்வின் அடிப்படை மாற்றம்.
நீங்கள் டெர்மினலில் ஒரு கட்டளையை உள்ளிடும்போது, AI உங்களுக்கு உதவுகிறது. இது "உதவி நிரலாக்கம்" அல்ல. இது "உரையாடல் நிரலாக்கம்".
அடிக்கோடு
Sonnet 4.6 ஒரு புரட்சி அல்ல.
இது AI மாதிரிகள் ஒரு பொருளாக மாறுவதற்கான மற்றொரு சான்று.
செயல்திறன் வேறுபாடு உணர முடியாத அளவுக்கு சிறியதாக இருக்கும்போது, விலை வேறுபாடு புறக்கணிக்க முடியாத அளவுக்கு பெரியதாக இருக்கும்போது, இந்த தொழில் முதிர்ச்சியடைந்து வருகிறது என்பதை நீங்கள் அறிவீர்கள்.
இது கெட்டது அல்ல. முதிர்ச்சி என்றால் ஸ்திரத்தன்மை. ஸ்திரத்தன்மை என்றால் கணிக்கக்கூடியது. கணிக்கக்கூடியது என்றால் அதன் மீது கட்ட முடியும்.
அடுத்த அலை கண்டுபிடிப்பு "புத்திசாலித்தனமான மாதிரியிலிருந்து" வராது. இது "மலிவான நுண்ணறிவிலிருந்து" வரும்.





