Claude Opus 4.6 + GPT-5.3 Codex: Quy trình làm việc song song, hiệu quả tăng gấp đôi
Các bạn thức đêm chờ đợi phiên bản mô hình mới, các bạn ổn chứ?
Anthropic và OpenAI cùng ngày phát hành các mô hình hàng đầu của mình. Bạn bè trên mạng xã hội đã tràn ngập các bài so sánh điểm chuẩn.
Nhưng hôm nay tôi không muốn nói về điểm chuẩn.
Tôi muốn nói về: Bản cập nhật này, bạn có thể nhận được gì từ nó?
🔥 Đầu tiên, một chi tiết khiến tôi rùng mình
Có một câu trong blog chính thức của OpenAI:
"GPT-5.3-Codex là mô hình đầu tiên của chúng tôi đóng vai trò quan trọng trong quá trình tạo ra chính nó."
Ý nghĩa là gì?
Trong quá trình phát triển GPT-5.3, nhóm OpenAI đã sử dụng phiên bản Codex ban đầu để gỡ lỗi quá trình đào tạo, quản lý triển khai và phân tích kết quả thử nghiệm.
Họ tự nói rằng "bị sốc bởi mức độ Codex có thể tăng tốc quá trình phát triển của chính họ".
AI bắt đầu tham gia vào quá trình phát triển của chính nó.
Điều này khiến tôi nhớ đến bài viết về Mao Đài mà tôi đã viết trước đây. Lúc đó tôi nói: "Mặc kệ nó có chết hay không, cứ dùng được thì cứ dùng đã."
Bây giờ tôi muốn nói: Tốc độ tiến hóa của AI có thể nhanh hơn chúng ta tưởng.
Đợi đến khi bạn "nghĩ thông suốt" rồi mới hành động, có thể đã muộn.
💜 Claude Opus 4.6: Không phải thông minh hơn, mà là thực sự có thể giúp bạn làm việc
Bản cập nhật lần này của Anthropic, tiêu đề blog chính thức rất thú vị: "Nâng cao tài chính với Claude Opus 4.6".
Họ đã tối ưu hóa đặc biệt cho ngành tài chính. Nhưng đừng vội bỏ qua, những khả năng này cũng hữu ích cho chúng ta.
🔧 Cowork: Cuối cùng cũng có thể thao tác trực tiếp trên các tệp cục bộ
Đây là tính năng tôi mong đợi nhất.
Trước đây khi sử dụng Claude, bạn phải sao chép và dán nội dung tệp vào.
Giờ đây với Cowork, bạn có thể cho phép Claude truy cập trực tiếp vào một thư mục trên máy tính của bạn, nó có thể đọc, chỉnh sửa và thậm chí tạo các tệp mới.
Hãy tưởng tượng: Bạn đưa thư mục bản thiết kế cho nó, để nó giúp bạn sắp xếp các quy tắc đặt tên, tạo tài liệu thiết kế và thậm chí xử lý hàng loạt hình ảnh.
Đây không phải là tương lai, mà là chức năng có thể sử dụng ngay bây giờ.

📊 Claude trong Excel và PowerPoint
Anthropic đã nhúng Claude trực tiếp vào thanh bên của Excel và PowerPoint.
CTO của Hebbia nói: "Trước đây làm PPT tài chính mất vài giờ, bây giờ chỉ mất vài phút."
Đối với những người làm báo cáo sản phẩm, đề xuất thiết kế, đây thực sự là một tin tốt.
Người đồng sáng lập Shortcut AI nói: "Bước nhảy vọt về hiệu suất của Opus 4.6 gần như không thể tin được. Các nhiệm vụ mà Opus 4.5 trước đây cảm thấy khó khăn, giờ đột nhiên trở nên dễ dàng hơn."
📈 Điểm chuẩn trong lĩnh vực tài chính
Dữ liệu chính thức:
Đánh giá Finance Agent: 60.7% (tăng 5.47% so với Opus 4.5)
TaxEval: 76.0%
Đánh giá Real-World Finance: Tăng 23 điểm phần trăm so với Sonnet 4.5
Những con số này cho thấy điều gì? Claude thực sự đã mạnh hơn trong việc xử lý các nhiệm vụ phức tạp, đòi hỏi suy luận nhiều bước.
💚 GPT-5.3 Codex: Cách tương tác đã thay đổi, đây mới là điểm quan trọng
⚡ Tốc độ tăng 25%, nhưng quan trọng hơn là cách tương tác đã thay đổi
Trước đây khi sử dụng Codex, bạn phải đợi nó chạy xong mới xem được kết quả. Muốn thay đổi hướng? Dừng lại và làm lại.
Bây giờ thì khác.
GPT-5.3 Codex sẽ báo cáo tiến độ trong khi làm việc, bạn có thể ngắt lời, đặt câu hỏi, điều chỉnh hướng bất cứ lúc nào mà không làm mất ngữ cảnh.
Cách tương tác này giống như cộng tác với một đồng nghiệp thực sự hơn.

🌐 Nâng cao khả năng phát triển trang web
Chính thức đã trình bày một ví dụ: Cho GPT-5.3 Codex và GPT-5.2 Codex mỗi bên làm một trang đích SaaS.
Phiên bản GPT-5.3:
✅ Tự động chuyển đổi giá thanh toán hàng năm thành giá trung bình hàng tháng, giúp giảm giá trực quan hơn
✅ Tạo một thành phần đánh giá của người dùng tự động xoay vòng, có ba đánh giá khác nhau
✅ Tổng thể giống một sản phẩm có thể trực tiếp đưa lên
Phiên bản GPT-5.2 tương đối đơn giản, cần điều chỉnh thủ công nhiều hơn.
Sự nâng cao về khả năng "hiểu ý định của người dùng" này rất hữu ích cho những người làm nguyên mẫu, làm Demo.
🔐 An ninh mạng: Mô hình đầu tiên được đánh dấu là "khả năng cao"
Thông tin này nhiều người không để ý.
GPT-5.3 Codex là mô hình đầu tiên của OpenAI được phân loại là "High capability" trong các nhiệm vụ an ninh mạng.
Họ đã đặc biệt ra mắt chương trình Trusted Access for Cyber và cam kết đầu tư 10 triệu đô la vào hạn mức API để hỗ trợ nghiên cứu phòng thủ an ninh mạng.
Giới hạn khả năng của AI đang mở rộng nhanh chóng.
📊 So sánh điểm chuẩn: Mỗi bên có thế mạnh riêng
Terminal-Bench 2.0 (khả năng lập trình thiết bị đầu cuối)
GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 Mức tăng: 13.3 điểm phần trăm
OSWorld-Verified (khả năng thao tác máy tính)
GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 Mức tăng: 26.5 điểm phần trăm
Nhìn chung, GPT-5.3 Codex có sự cải thiện lớn về khả năng thao tác thiết bị đầu cuối và sử dụng máy tính.

🍺 Logic Mao Đài: Trước khi chúng "chết", bạn có thể nhận được gì?
Trước đây tôi đã viết một bài viết, sử dụng logic mua Mao Đài của Đoàn Vĩnh Bình để giải thích giá trị của các công cụ AI.
Quan điểm cốt lõi là:
Copilot có bị thay thế không? Có thể.
Cursor có hào bảo vệ không? Thực sự không sâu.
Claude Code có phải là hình thái cuối cùng không? Chắc chắn là không.
Nhưng những điều này không quan trọng.
Điều quan trọng là: Trước khi chúng "chết", bạn có thể nhận được bao nhiêu lợi nhuận?
Bây giờ Claude Opus 4.6 và GPT-5.3 Codex đã đến, câu hỏi tương tự:
Hai mô hình này có bị thay thế không? Chắc chắn là có.
Chúng có phải là hình thái cuối cùng của AI không? Tất nhiên là không.
Nhưng trước khi chúng bị thay thế thì sao?
Có người sẽ sử dụng Cowork để tăng hiệu quả tài liệu thiết kế lên 10 lần.
Có người sẽ sử dụng Claude trong Excel để rút ngắn thời gian phân tích dữ liệu từ một ngày xuống một giờ.
Có người sẽ sử dụng cộng tác tương tác của GPT-5.3 Codex để tạo ra một SaaS hoàn chỉnh trong một tuần.
Còn bạn thì sao? Vẫn đang chờ đợi "công cụ tốt hơn" xuất hiện?
🎯 Đề xuất lựa chọn của tôi
Làm đề xuất thiết kế, báo cáo sản phẩm, phân tích dữ liệu → Claude Opus 4.6
👉 Cowork + tích hợp Excel/PowerPoint, thân thiện hơn với các tình huống văn phòng
Phát triển nguyên mẫu, viết mã, gỡ lỗi → GPT-5.3 Codex
👉 Khả năng thiết bị đầu cuối mạnh mẽ, trải nghiệm tương tác tốt, tốc độ nhanh
Sử dụng cả hai → Đây là lựa chọn của tôi
👉 Claude thực hiện nghiên cứu và tài liệu ban đầu, GPT thực hiện phát triển và gỡ lỗi sau này
Còn một cân nhắc thực tế: GPT ổn định hơn khi sử dụng trong nước.

💰 Giá cả
Claude Opus 4.6
Đầu vào: $5 / triệu token Đầu ra: $25 / triệu token Vượt quá 200.000 token ngữ cảnh: $10 / $37.50
GPT-5.3 Codex
Giá API chưa được công bố Hiện tại sử dụng thông qua đăng ký ChatGPT Plus/Pro
✨ Lời cuối
Điều khiến tôi cảm nhận sâu sắc nhất từ bản cập nhật này không phải là điểm chuẩn đã tăng bao nhiêu, mà là cách làm việc của AI đang thay đổi.
Claude bắt đầu thao tác trực tiếp vào hệ thống tệp của bạn.
GPT bắt đầu trò chuyện với bạn trong khi làm việc.
AI bắt đầu tham gia vào quá trình phát triển của chính nó.
Một năm trước, chúng ta vẫn đang thảo luận về việc AI có thể viết mã hay không.
Bây giờ, chúng ta đang thảo luận về việc AI có thể hoàn thành một dự án độc lập hay không.
Một năm nữa thì sao?
Tôi không biết câu trả lời.
Nhưng tôi biết một điều: Những người kiếm được tiền từ các công cụ AI, họ không phải là không biết những công cụ này sẽ bị thay thế.
Họ chỉ hiểu rõ: Mặc kệ nó có chết hay không, cứ dùng được thì cứ dùng đã.Đợi đến khi bạn "nghĩ thông suốt" thì lợi nhuận đã bị chia hết rồi.





