Claude Sonnet 4.6: Hiệu suất mô hình giảm dần

Giảm dần

Một bản nâng cấp mô hình "tốt" là gì?

Nếu bạn hỏi người bình thường, họ sẽ nói: thông minh hơn. Nếu bạn hỏi doanh nghiệp, họ sẽ nói: rẻ hơn.

Sonnet 4.6 đang làm điều thứ hai.

"Nó tiếp cận trí thông minh cấp Opus với một mức giá khiến nó trở nên thiết thực cho nhiều tác vụ hơn." — @claudeai

Đây không phải là một đột phá về công nghệ. Đây là một chiến lược kinh doanh.

Khi tiến bộ công nghệ chậm lại, chi phí trở thành một yếu tố cạnh tranh. Đây không phải là thất bại, mà là sự trưởng thành.

Tại sao không phải là Sonnet 5?

Có người nói rằng Anthropic ban đầu định gọi nó là Sonnet 5.

"Họ đã đổi tên sonnet-5 thành 4.6 (lý do rất đơn giản - họ đang để dành 5 cho một bước nhảy lớn)" — @chetaslua

Việc đặt tên này tự nó đã là một tín hiệu. Anthropic biết rằng đây không phải là một bước nhảy vọt lớn.

Khi một công ty thay đổi số phiên bản từ 5 thành 4.6, họ đang nói: đây là một bản cập nhật gia tăng, không phải là một kỷ nguyên mới.

70% và 59%

Hai con số đáng chú ý:

70%: Người dùng Claude Code thích Sonnet 4.6 hơn Sonnet 4.5
59%: Các nhà phát triển cho rằng Sonnet 4.6 tốt hơn Opus 4.5

Hai con số này cho thấy cùng một điều: mô hình tầm trung đang bắt kịp mô hình cao cấp.

Claude Sonnet 4.6

Điều này không phải vì tầm trung trở nên tốt hơn, mà là vì lợi nhuận biên của cao cấp đang giảm dần.

1M ngữ cảnh

Sonnet 4.6 có cửa sổ ngữ cảnh 1 triệu token (phiên bản beta).

Nhưng đây có phải là điều người dùng muốn?

"Hầu hết các nhà xây dựng sẽ sử dụng Claude Sonnet 4.6 sai cách. Họ sẽ bật ngữ cảnh 1M cho mọi thứ. Sau đó phàn nàn về chi phí. Sonnet 4.6 ở 200K + bộ nhớ đệm nhắc nhở sẽ hoạt động tốt hơn hầu hết các thiết lập ngữ cảnh tối đa cho 90% quy trình làm việc." — @EarthExcursions

Ngữ cảnh lớn hơn không có nghĩa là kết quả tốt hơn. Trong hầu hết các trường hợp, nó chỉ là một hóa đơn cao hơn.

Tích hợp GitHub Copilot

Sonnet 4.6 đã được triển khai trên GitHub Copilot.

"Claude Sonnet 4.6 hiện đã có sẵn rộng rãi và đang được triển khai trong GitHub Copilot." — @github

Điều này cho thấy gì? Các công cụ dành cho nhà phát triển đang trở thành chiến trường đầu tiên của các mô hình AI.

OpenAI có Cursor. Anthropic có Copilot. Google vẫn chưa nghĩ ra.

Đây không phải là về việc mô hình của ai thông minh hơn. Đây là về việc ai ở trong cửa sổ đầu tiên mà các nhà phát triển mở mỗi ngày.

Cuộc chiến giá cả đã bắt đầu

Tính năng quan trọng nhất của Sonnet 4.6 không nằm trong mô hình, mà nằm trong giá cả.

"Claude Sonnet 4.6 hoạt động cực kỳ tốt và ngang bằng với Claude Opus 4.6 trong khi rẻ hơn gần 50%" — @bridgemindai

Đây là dấu hiệu cho thấy ngành công nghiệp AI đang bước vào giai đoạn trưởng thành.

Khi sự khác biệt về sản phẩm trở nên nhỏ hơn, cạnh tranh về giá bắt đầu. Khi cạnh tranh về giá bắt đầu, tỷ suất lợi nhuận giảm. Khi tỷ suất lợi nhuận giảm, chỉ những người chơi quy mô mới có thể sống sót.

Anthropic đang làm là: đổi giá lấy thị phần.

Còn ai dùng ChatGPT không?

Một dòng tweet của một người dùng Ba Lan:

"Claude Sonnet 4.6 vừa ra mắt. Và thành thật mà nói? Tôi không biết tại sao ai đó vẫn sử dụng ChatGPT." — @nauczymycieAI

Đây là một cảm nhận thực tế của người dùng. Không phải là đánh giá kỹ thuật, không phải là kiểm tra điểm chuẩn, chỉ là cảm nhận.

Cảm nhận rất quan trọng. Khi hai sản phẩm có chức năng tương tự, người dùng sẽ chọn sản phẩm "cảm thấy tốt hơn".

Thiết bị đầu cuối là IDE mới

Việc tích hợp Copilot CLI của GitHub cho thấy một xu hướng:

Mã đang được viết từ IDE vào thiết bị đầu cuối.

"Hãy dùng thử trong VS Code hoặc Copilot CLI." — @github

Đây không phải là một chi tiết kỹ thuật. Đây là một sự thay đổi cơ bản trong quy trình làm việc của nhà phát triển.

Khi bạn nhập một lệnh trong thiết bị đầu cuối, AI sẽ giúp bạn hoàn thành. Đây không phải là "lập trình hỗ trợ". Đây là "lập trình hội thoại".

Điểm mấu chốt

Sonnet 4.6 không phải là một cuộc cách mạng.

Nó là một bằng chứng khác cho thấy các mô hình AI đang trở thành hàng hóa.

Khi sự khác biệt về hiệu suất quá nhỏ để nhận thấy, sự khác biệt về giá quá lớn để bỏ qua, bạn biết rằng ngành công nghiệp này đang trưởng thành.

Đây không phải là điều xấu. Trưởng thành có nghĩa là ổn định. Ổn định có nghĩa là có thể dự đoán được. Có thể dự đoán được có nghĩa là có thể xây dựng trên nó.

Làn sóng đổi mới tiếp theo sẽ không đến từ "các mô hình thông minh hơn". Nó sẽ đến từ "trí thông minh rẻ hơn".

Claude Sonnet 4.6: Hiệu suất mô hình giảm dần

Giảm dần

Tại sao không phải là Sonnet 5?

70% và 59%

1M ngữ cảnh

Tích hợp GitHub Copilot

Cuộc chiến giá cả đã bắt đầu

Còn ai dùng ChatGPT không?

Thiết bị đầu cuối là IDE mới

Điểm mấu chốt

You Might Also Like

Hướng dẫn chỉnh sửa Claude Code Buddy: Cách nhận thú cưng huyền thoại phát sáng

Obsidian đã ra mắt Defuddle, đưa Obsidian Web Clipper lên một tầm cao mới

OpenAI đột ngột công bố "ba trong một": Trình duyệt + lập trình + ChatGPT hợp nhất, nội bộ thừa nhận đã đi sai đường trong năm qua

2026, không còn ép bản thân 'kỷ luật'! Làm tốt 8 việc nhỏ này, sức khỏe tự nhiên đến

Những bà mẹ cố gắng giảm cân nhưng không thành công, chắc chắn đều mắc phải điều này

Hướng dẫn vận hành ổn định AI Browser 24 giờ