Claude Sonnet 4.6: Modelio našumo mažėjantis prieaugis
Mažėjantis prieaugis
Kas yra „geras“ modelio atnaujinimas?
Jei paklaustumėte paprastų žmonių, jie pasakytų: protingesnis. Jei paklaustumėte įmonių, jos pasakytų: pigesnis.
Sonnet 4.6 daro antrą dalyką.
„Jis artėja prie Opus lygio intelekto už tokią kainą, kuri leidžia jį praktiškai naudoti daug daugiau užduočių.“ – @claudeai
Tai nėra technologinis proveržis. Tai yra verslo strategija.
Kai technologinė pažanga sulėtėja, kaina tampa konkurencijos matmeniu. Tai nėra nesėkmė, tai yra branda.
Kodėl ne Sonnet 5?
Kai kas sako, kad Anthropic iš pradžių ketino jį pavadinti Sonnet 5.
„Jie pervadino sonnet-5 į 4.6 (priežastis paprasta – jie taupo 5 dideliam šuoliui)“ – @chetaslua
Šis pavadinimas pats savaime yra signalas. Anthropic žino, kad tai nėra didelis šuolis.
Kai įmonė pakeičia versijos numerį iš 5 į 4.6, jie sako: tai yra laipsniškas atnaujinimas, o ne nauja era.
70% ir 59%
Dvi skaičiai yra verti dėmesio:
- 70%: Claude Code vartotojai labiau mėgsta Sonnet 4.6 nei Sonnet 4.5
- 59%: Kūrėjai mano, kad Sonnet 4.6 yra pranašesnis už Opus 4.5
Šie du skaičiai rodo tą patį dalyką: vidutinės klasės modelis vejasi aukščiausios klasės modelį.

Taip yra ne todėl, kad vidutinės klasės modelis pagerėjo, o todėl, kad aukščiausios klasės modelio ribinis pelnas mažėja.
1M kontekstas
Sonnet 4.6 turi 1 milijono tokenų konteksto langą (beta versija).
Bet ar to nori vartotojai?
„Dauguma kūrėjų naudos Claude Sonnet 4.6 neteisingai. Jie įjungs 1M kontekstą viskam. Tada skųsis dėl kainos. Sonnet 4.6 su 200K + prompt caching veiks geriau nei dauguma maksimalaus konteksto sąrankų 90% darbo eigų.“ – @EarthExcursions
Didesnis kontekstas nereiškia geresnių rezultatų. Dažniausiai tai tiesiog didesnė sąskaita.
GitHub Copilot integracija
Sonnet 4.6 jau veikia GitHub Copilot.
„Claude Sonnet 4.6 dabar yra visuotinai prieinamas ir diegiamas GitHub Copilot.“ – @github
Ką tai rodo? Kūrėjų įrankiai tampa pirmuoju AI modelių mūšio lauku.
OpenAI turi Cursor. Anthropic turi Copilot. Google dar neapsisprendė.
Tai ne apie tai, kieno modelis protingesnis. Tai apie tai, kas yra pirmame lange, kurį kūrėjai atidaro kiekvieną dieną.
Kainų karas jau prasidėjo
Svarbiausia Sonnet 4.6 savybė yra ne modelyje, o kainodaroje.
„Claude Sonnet 4.6 veikia neįtikėtinai gerai ir panašiai kaip Claude Opus 4.6, o yra beveik 50% pigesnis“ – @bridgemindai
Tai yra AI pramonės įžengimo į brandos etapą ženklas.
Kai produktų diferenciacija tampa mažesnė, prasideda konkurencija dėl kainos. Kai prasideda konkurencija dėl kainos, mažėja pelno marža. Kai pelno marža mažėja, išgyvena tik didelio masto žaidėjai.
Anthropic daro tai: keičia kainą į rinkos dalį.
Ar dar kas nors naudoja ChatGPT?
Lenkijos vartotojo tviteris:
„Ką tik pasirodė Claude Sonnet 4.6. Ir atvirai? Nežinau, kodėl kas nors vis dar naudotų ChatGPT.“ – @nauczymycieAI
Tai yra tikras vartotojo jausmas. Ne techninis įvertinimas, ne etaloninis testas, tiesiog jausmas.
Jausmas yra svarbus. Kai dviejų produktų funkcijos yra panašios, vartotojai pasirinks tą, kuris „jaučiasi geriau“.
Terminalas yra nauja IDE
GitHub Copilot CLI integracija rodo tendenciją:
Kodas rašomas iš IDE į terminalą.
„Išbandykite VS Code arba Copilot CLI.“ – @github
Tai nėra techninė detalė. Tai yra esminis kūrėjų darbo eigos pokytis.
Kai įvedate komandą terminale, AI padeda jums ją atlikti. Tai nėra „pagalbinis programavimas“. Tai yra „pokalbio programavimas“.
Esmė
Sonnet 4.6 nėra revoliucija.
Tai dar vienas įrodymas, kad AI modeliai tampa žaliavomis.
Kai našumo skirtumai yra per maži, kad juos būtų galima pastebėti, o kainų skirtumai yra per dideli, kad juos būtų galima ignoruoti, žinote, kad ši pramonė bręsta.
Tai nėra blogai. Branda reiškia stabilumą. Stabilumas reiškia nuspėjamumą. Nuspėjamumas reiškia, kad galima ant jo statyti.
Kita inovacijų banga ateis ne iš „protingesnių modelių“. Ji ateis iš „pigesnio intelekto“.





