Claude Sonnet 4.6: Modeļa veiktspējas robežpeļņas samazināšanās
Robežpeļņas samazināšanās
Kas ir "labs" modeļa atjauninājums?
Ja jūs jautātu parastam cilvēkam, viņi teiktu: gudrāks. Ja jūs jautātu uzņēmumam, viņi teiktu: lētāks.
Sonnet 4.6 dara otro lietu.
"Tas tuvojas Opus līmeņa inteliģencei par cenu, kas padara to praktisku daudz vairāk uzdevumiem." — @claudeai
Tas nav tehnisks izrāviens. Tā ir biznesa stratēģija.
Kad tehnoloģiskais progress palēninās, izmaksas kļūst par konkurences dimensiju. Tā nav neveiksme, tas ir briedums.
Kāpēc ne Sonnet 5?
Daži saka, ka Anthropic sākotnēji plānoja to nosaukt par Sonnet 5.
"Viņi pārdēvēja sonnet-5 par 4.6 (iemesls ir vienkāršs - viņi taupa 5 lielam lēcienam)" — @chetaslua
Šis nosaukums pats par sevi ir signāls. Anthropic zina, ka tas nav liels lēciens.
Kad uzņēmums maina versijas numuru no 5 uz 4.6, viņi saka: šis ir pakāpenisks atjauninājums, nevis jauns laikmets.
70% un 59%
Divi skaitļi ir jāņem vērā:
- 70%: Claude Code lietotāji dod priekšroku Sonnet 4.6, nevis Sonnet 4.5
- 59%: Izstrādātāji uzskata, ka Sonnet 4.6 ir labāks par Opus 4.5
Šie divi skaitļi ilustrē vienu un to pašu: vidējās klases modelis panāk augstākās klases modeli.

Tas nav tāpēc, ka vidējās klases modelis ir kļuvis labāks, bet gan tāpēc, ka augstākās klases modeļa robežpeļņa samazinās.
1M konteksts
Sonnet 4.6 ir 1 miljona tokenu konteksta logs (beta versija).
Bet vai tas ir tas, ko lietotāji vēlas?
"Lielākā daļa veidotāju nepareizi izmantos Claude Sonnet 4.6. Viņi ieslēgs 1M kontekstu visam. Pēc tam sūdzēsies par izmaksām. Sonnet 4.6 ar 200K + ātru kešatmiņu pārspēs lielāko daļu maksimālā konteksta iestatījumu 90% darbplūsmu." — @EarthExcursions
Lielāks konteksts nenozīmē labākus rezultātus. Vairumā gadījumu tas ir tikai lielāks rēķins.
GitHub Copilot integrācija
Sonnet 4.6 jau ir pieejams GitHub Copilot.
"Claude Sonnet 4.6 tagad ir vispārpieejams un tiek ieviests GitHub Copilot." — @github
Ko tas nozīmē? Izstrādātāju rīki kļūst par pirmo AI modeļu kaujas lauku.
OpenAI ir Cursor. Anthropic ir Copilot. Google vēl nav izdomājis.
Tas nav par to, kurš modelis ir gudrāks. Tas ir par to, kurš atrodas pirmajā logā, ko izstrādātāji atver katru dienu.
Cenu karš ir sācies
Sonnet 4.6 svarīgākā iezīme nav modelī, bet gan cenā.
"Claude Sonnet 4.6 darbojas neticami labi un ir līdzvērtīgs Claude Opus 4.6, vienlaikus esot gandrīz par 50% lētāks" — @bridgemindai
Tas ir AI nozares ienākšanas brieduma fāzē simbols.
Kad produktu diferenciācija kļūst mazāka, sākas cenu konkurence. Kad sākas cenu konkurence, peļņas norma samazinās. Kad peļņas norma samazinās, izdzīvot var tikai liela mēroga spēlētāji.
Anthropic dara to: maina cenu pret tirgus daļu.
Vai vēl kāds izmanto ChatGPT?
Poļu lietotāja tvīts:
"Claude Sonnet 4.6 tikko iznāca. Un godīgi? Es nezinu, kāpēc kāds joprojām izmantotu ChatGPT." — @nauczymycieAI
Tā ir reāla lietotāja sajūta. Ne tehnisks novērtējums, ne etalonu testi, tikai sajūta.
Sajūtas ir svarīgas. Kad divi produkti ir līdzīgi pēc funkcijām, lietotāji izvēlas to, kas "liekas labāks".
Terminālis ir jauna IDE
GitHub Copilot CLI integrācija ilustrē tendenci:
Kods tiek rakstīts no IDE terminālī.
"Izmēģiniet to VS Code vai Copilot CLI." — @github
Tas nav tehnisks sīkums. Tā ir fundamentāla izmaiņa izstrādātāju darbplūsmā.
Kad jūs terminālī ievadāt komandu, AI palīdz jums to pabeigt. Tas nav "palīdzības programmēšana". Tā ir "sarunvalodas programmēšana".
Apakšējā līnija
Sonnet 4.6 nav revolūcija.
Tā ir vēl viens pierādījums tam, ka AI modeļi kļūst par precēm.
Kad veiktspējas atšķirības ir pārāk mazas, lai tās uztvertu, un cenu atšķirības ir pārāk lielas, lai tās ignorētu, jūs zināt, ka nozare nobriest.
Tas nav slikti. Briedums nozīmē stabilitāti. Stabilitāte nozīmē paredzamību. Paredzamība nozīmē, ka uz tā var būvēt.
Nākamais inovāciju vilnis nenāks no "gudrākiem modeļiem". Tas nāks no "lētākas inteliģences".





