Claude Sonnet 4.6: Modelio našumo mažėjantis prieaugis

Mažėjantis prieaugis

Kas yra „geras“ modelio atnaujinimas?

Jei paklaustumėte paprastų žmonių, jie pasakytų: protingesnis. Jei paklaustumėte įmonių, jos pasakytų: pigesnis.

Sonnet 4.6 daro antrą dalyką.

„Jis artėja prie Opus lygio intelekto už tokią kainą, kuri leidžia jį praktiškai naudoti daug daugiau užduočių.“ – @claudeai

Tai nėra technologinis proveržis. Tai yra verslo strategija.

Kai technologinė pažanga sulėtėja, kaina tampa konkurencijos matmeniu. Tai nėra nesėkmė, tai yra branda.

Kodėl ne Sonnet 5?

Kai kas sako, kad Anthropic iš pradžių ketino jį pavadinti Sonnet 5.

„Jie pervadino sonnet-5 į 4.6 (priežastis paprasta – jie taupo 5 dideliam šuoliui)“ – @chetaslua

Šis pavadinimas pats savaime yra signalas. Anthropic žino, kad tai nėra didelis šuolis.

Kai įmonė pakeičia versijos numerį iš 5 į 4.6, jie sako: tai yra laipsniškas atnaujinimas, o ne nauja era.

70% ir 59%

Dvi skaičiai yra verti dėmesio:

70%: Claude Code vartotojai labiau mėgsta Sonnet 4.6 nei Sonnet 4.5
59%: Kūrėjai mano, kad Sonnet 4.6 yra pranašesnis už Opus 4.5

Šie du skaičiai rodo tą patį dalyką: vidutinės klasės modelis vejasi aukščiausios klasės modelį.

Claude Sonnet 4.6

Taip yra ne todėl, kad vidutinės klasės modelis pagerėjo, o todėl, kad aukščiausios klasės modelio ribinis pelnas mažėja.

1M kontekstas

Sonnet 4.6 turi 1 milijono tokenų konteksto langą (beta versija).

Bet ar to nori vartotojai?

„Dauguma kūrėjų naudos Claude Sonnet 4.6 neteisingai. Jie įjungs 1M kontekstą viskam. Tada skųsis dėl kainos. Sonnet 4.6 su 200K + prompt caching veiks geriau nei dauguma maksimalaus konteksto sąrankų 90% darbo eigų.“ – @EarthExcursions

Didesnis kontekstas nereiškia geresnių rezultatų. Dažniausiai tai tiesiog didesnė sąskaita.

GitHub Copilot integracija

Sonnet 4.6 jau veikia GitHub Copilot.

„Claude Sonnet 4.6 dabar yra visuotinai prieinamas ir diegiamas GitHub Copilot.“ – @github

Ką tai rodo? Kūrėjų įrankiai tampa pirmuoju AI modelių mūšio lauku.

OpenAI turi Cursor. Anthropic turi Copilot. Google dar neapsisprendė.

Tai ne apie tai, kieno modelis protingesnis. Tai apie tai, kas yra pirmame lange, kurį kūrėjai atidaro kiekvieną dieną.

Kainų karas jau prasidėjo

Svarbiausia Sonnet 4.6 savybė yra ne modelyje, o kainodaroje.

„Claude Sonnet 4.6 veikia neįtikėtinai gerai ir panašiai kaip Claude Opus 4.6, o yra beveik 50% pigesnis“ – @bridgemindai

Tai yra AI pramonės įžengimo į brandos etapą ženklas.

Kai produktų diferenciacija tampa mažesnė, prasideda konkurencija dėl kainos. Kai prasideda konkurencija dėl kainos, mažėja pelno marža. Kai pelno marža mažėja, išgyvena tik didelio masto žaidėjai.

Anthropic daro tai: keičia kainą į rinkos dalį.

Ar dar kas nors naudoja ChatGPT?

Lenkijos vartotojo tviteris:

„Ką tik pasirodė Claude Sonnet 4.6. Ir atvirai? Nežinau, kodėl kas nors vis dar naudotų ChatGPT.“ – @nauczymycieAI

Tai yra tikras vartotojo jausmas. Ne techninis įvertinimas, ne etaloninis testas, tiesiog jausmas.

Jausmas yra svarbus. Kai dviejų produktų funkcijos yra panašios, vartotojai pasirinks tą, kuris „jaučiasi geriau“.

Terminalas yra nauja IDE

GitHub Copilot CLI integracija rodo tendenciją:

Kodas rašomas iš IDE į terminalą.

„Išbandykite VS Code arba Copilot CLI.“ – @github

Tai nėra techninė detalė. Tai yra esminis kūrėjų darbo eigos pokytis.

Kai įvedate komandą terminale, AI padeda jums ją atlikti. Tai nėra „pagalbinis programavimas“. Tai yra „pokalbio programavimas“.

Esmė

Sonnet 4.6 nėra revoliucija.

Tai dar vienas įrodymas, kad AI modeliai tampa žaliavomis.

Kai našumo skirtumai yra per maži, kad juos būtų galima pastebėti, o kainų skirtumai yra per dideli, kad juos būtų galima ignoruoti, žinote, kad ši pramonė bręsta.

Tai nėra blogai. Branda reiškia stabilumą. Stabilumas reiškia nuspėjamumą. Nuspėjamumas reiškia, kad galima ant jo statyti.

Kita inovacijų banga ateis ne iš „protingesnių modelių“. Ji ateis iš „pigesnio intelekto“.

Claude Sonnet 4.6: Modelio našumo mažėjantis prieaugis

Mažėjantis prieaugis

Kodėl ne Sonnet 5?

70% ir 59%

1M kontekstas

GitHub Copilot integracija

Kainų karas jau prasidėjo

Ar dar kas nors naudoja ChatGPT?

Terminalas yra nauja IDE

Esmė

You Might Also Like

Claude Code Buddy modificavimo vadovas: kaip gauti blizgantį legendinį augintinį

Obsidian pristatė Defuddle, pakeldama Obsidian Web Clipper į naujas aukštumas

OpenAI staiga paskelbė "trijų viename": naršyklė + programavimas + ChatGPT sujungimas, viduje pripažinta, kad per pastaruosius metus buvo padaryta klaida

2026, nebe reikės priversti save "savarankiškai"! Pasirūpinkite šiomis 8 mažomis užduotimis, sveikata ateis natūraliai

Motinos, kurios stengiasi numesti svorio, bet nesugeba, tikrai klysta čia

AI Naršyklė 24 valandų stabilaus veikimo vadovas