Claude Opus 4.6 + GPT-5.3 Codex: Quy trình làm việc song song, hiệu quả tăng gấp đôi

2/13/2026
9 min read

Các bạn thức đêm chờ đợi phiên bản mô hình mới, các bạn ổn chứ?

Anthropic và OpenAI cùng ngày phát hành các mô hình hàng đầu của mình. Bạn bè trên mạng xã hội đã tràn ngập các bài so sánh điểm chuẩn.

Nhưng hôm nay tôi không muốn nói về điểm chuẩn.

Tôi muốn nói về: Bản cập nhật này, bạn có thể nhận được gì từ nó?

Quy trình làm việc cộng tác song song🔥 Đầu tiên, một chi tiết khiến tôi rùng mình

Có một câu trong blog chính thức của OpenAI:

"GPT-5.3-Codex là mô hình đầu tiên của chúng tôi đóng vai trò quan trọng trong quá trình tạo ra chính nó."

Ý nghĩa là gì?

Trong quá trình phát triển GPT-5.3, nhóm OpenAI đã sử dụng phiên bản Codex ban đầu để gỡ lỗi quá trình đào tạo, quản lý triển khai và phân tích kết quả thử nghiệm.

Họ tự nói rằng "bị sốc bởi mức độ Codex có thể tăng tốc quá trình phát triển của chính họ".

AI bắt đầu tham gia vào quá trình phát triển của chính nó.

Điều này khiến tôi nhớ đến bài viết về Mao Đài mà tôi đã viết trước đây. Lúc đó tôi nói: "Mặc kệ nó có chết hay không, cứ dùng được thì cứ dùng đã."

Bây giờ tôi muốn nói: Tốc độ tiến hóa của AI có thể nhanh hơn chúng ta tưởng.

Đợi đến khi bạn "nghĩ thông suốt" rồi mới hành động, có thể đã muộn.

💜 Claude Opus 4.6: Không phải thông minh hơn, mà là thực sự có thể giúp bạn làm việc

Bản cập nhật lần này của Anthropic, tiêu đề blog chính thức rất thú vị: "Nâng cao tài chính với Claude Opus 4.6".

Họ đã tối ưu hóa đặc biệt cho ngành tài chính. Nhưng đừng vội bỏ qua, những khả năng này cũng hữu ích cho chúng ta.

🔧 Cowork: Cuối cùng cũng có thể thao tác trực tiếp trên các tệp cục bộ

Đây là tính năng tôi mong đợi nhất.

Trước đây khi sử dụng Claude, bạn phải sao chép và dán nội dung tệp vào.

Giờ đây với Cowork, bạn có thể cho phép Claude truy cập trực tiếp vào một thư mục trên máy tính của bạn, nó có thể đọc, chỉnh sửa và thậm chí tạo các tệp mới.

Hãy tưởng tượng: Bạn đưa thư mục bản thiết kế cho nó, để nó giúp bạn sắp xếp các quy tắc đặt tên, tạo tài liệu thiết kế và thậm chí xử lý hàng loạt hình ảnh.

Đây không phải là tương lai, mà là chức năng có thể sử dụng ngay bây giờ.

Chức năng Cowork

📊 Claude trong Excel và PowerPoint

Anthropic đã nhúng Claude trực tiếp vào thanh bên của Excel và PowerPoint.

CTO của Hebbia nói: "Trước đây làm PPT tài chính mất vài giờ, bây giờ chỉ mất vài phút."

Đối với những người làm báo cáo sản phẩm, đề xuất thiết kế, đây thực sự là một tin tốt.

Người đồng sáng lập Shortcut AI nói: "Bước nhảy vọt về hiệu suất của Opus 4.6 gần như không thể tin được. Các nhiệm vụ mà Opus 4.5 trước đây cảm thấy khó khăn, giờ đột nhiên trở nên dễ dàng hơn."

📈 Điểm chuẩn trong lĩnh vực tài chính

Dữ liệu chính thức:

Đánh giá Finance Agent: 60.7% (tăng 5.47% so với Opus 4.5)

TaxEval: 76.0%

Đánh giá Real-World Finance: Tăng 23 điểm phần trăm so với Sonnet 4.5

Những con số này cho thấy điều gì? Claude thực sự đã mạnh hơn trong việc xử lý các nhiệm vụ phức tạp, đòi hỏi suy luận nhiều bước.

💚 GPT-5.3 Codex: Cách tương tác đã thay đổi, đây mới là điểm quan trọng

⚡ Tốc độ tăng 25%, nhưng quan trọng hơn là cách tương tác đã thay đổi

Trước đây khi sử dụng Codex, bạn phải đợi nó chạy xong mới xem được kết quả. Muốn thay đổi hướng? Dừng lại và làm lại.

Bây giờ thì khác.

GPT-5.3 Codex sẽ báo cáo tiến độ trong khi làm việc, bạn có thể ngắt lời, đặt câu hỏi, điều chỉnh hướng bất cứ lúc nào mà không làm mất ngữ cảnh.

Cách tương tác này giống như cộng tác với một đồng nghiệp thực sự hơn.

So sánh cách tương tác

🌐 Nâng cao khả năng phát triển trang web

Chính thức đã trình bày một ví dụ: Cho GPT-5.3 Codex và GPT-5.2 Codex mỗi bên làm một trang đích SaaS.

Phiên bản GPT-5.3:

✅ Tự động chuyển đổi giá thanh toán hàng năm thành giá trung bình hàng tháng, giúp giảm giá trực quan hơn

✅ Tạo một thành phần đánh giá của người dùng tự động xoay vòng, có ba đánh giá khác nhau

✅ Tổng thể giống một sản phẩm có thể trực tiếp đưa lên

Phiên bản GPT-5.2 tương đối đơn giản, cần điều chỉnh thủ công nhiều hơn.

Sự nâng cao về khả năng "hiểu ý định của người dùng" này rất hữu ích cho những người làm nguyên mẫu, làm Demo.

🔐 An ninh mạng: Mô hình đầu tiên được đánh dấu là "khả năng cao"

Thông tin này nhiều người không để ý.

GPT-5.3 Codex là mô hình đầu tiên của OpenAI được phân loại là "High capability" trong các nhiệm vụ an ninh mạng.

Họ đã đặc biệt ra mắt chương trình Trusted Access for Cyber và cam kết đầu tư 10 triệu đô la vào hạn mức API để hỗ trợ nghiên cứu phòng thủ an ninh mạng.

Giới hạn khả năng của AI đang mở rộng nhanh chóng.

📊 So sánh điểm chuẩn: Mỗi bên có thế mạnh riêng

Terminal-Bench 2.0 (khả năng lập trình thiết bị đầu cuối)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 Mức tăng: 13.3 điểm phần trăm

OSWorld-Verified (khả năng thao tác máy tính)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 Mức tăng: 26.5 điểm phần trăm

Nhìn chung, GPT-5.3 Codex có sự cải thiện lớn về khả năng thao tác thiết bị đầu cuối và sử dụng máy tính.

So sánh điểm chuẩn

🍺 Logic Mao Đài: Trước khi chúng "chết", bạn có thể nhận được gì?

Trước đây tôi đã viết một bài viết, sử dụng logic mua Mao Đài của Đoàn Vĩnh Bình để giải thích giá trị của các công cụ AI.

Quan điểm cốt lõi là:

Copilot có bị thay thế không? Có thể.

Cursor có hào bảo vệ không? Thực sự không sâu.

Claude Code có phải là hình thái cuối cùng không? Chắc chắn là không.

Nhưng những điều này không quan trọng.

Điều quan trọng là: Trước khi chúng "chết", bạn có thể nhận được bao nhiêu lợi nhuận?

Bây giờ Claude Opus 4.6 và GPT-5.3 Codex đã đến, câu hỏi tương tự:

Hai mô hình này có bị thay thế không? Chắc chắn là có.

Chúng có phải là hình thái cuối cùng của AI không? Tất nhiên là không.

Nhưng trước khi chúng bị thay thế thì sao?

Có người sẽ sử dụng Cowork để tăng hiệu quả tài liệu thiết kế lên 10 lần.

Có người sẽ sử dụng Claude trong Excel để rút ngắn thời gian phân tích dữ liệu từ một ngày xuống một giờ.

Có người sẽ sử dụng cộng tác tương tác của GPT-5.3 Codex để tạo ra một SaaS hoàn chỉnh trong một tuần.

Còn bạn thì sao? Vẫn đang chờ đợi "công cụ tốt hơn" xuất hiện?

🎯 Đề xuất lựa chọn của tôi

Làm đề xuất thiết kế, báo cáo sản phẩm, phân tích dữ liệu → Claude Opus 4.6

👉 Cowork + tích hợp Excel/PowerPoint, thân thiện hơn với các tình huống văn phòng

Phát triển nguyên mẫu, viết mã, gỡ lỗi → GPT-5.3 Codex

👉 Khả năng thiết bị đầu cuối mạnh mẽ, trải nghiệm tương tác tốt, tốc độ nhanh

Sử dụng cả hai → Đây là lựa chọn của tôi

👉 Claude thực hiện nghiên cứu và tài liệu ban đầu, GPT thực hiện phát triển và gỡ lỗi sau này

Còn một cân nhắc thực tế: GPT ổn định hơn khi sử dụng trong nước.

Đề xuất lựa chọn

💰 Giá cả

Claude Opus 4.6

Đầu vào: $5 / triệu token Đầu ra: $25 / triệu token Vượt quá 200.000 token ngữ cảnh: $10 / $37.50

GPT-5.3 Codex

Giá API chưa được công bố Hiện tại sử dụng thông qua đăng ký ChatGPT Plus/Pro

✨ Lời cuối

Điều khiến tôi cảm nhận sâu sắc nhất từ bản cập nhật này không phải là điểm chuẩn đã tăng bao nhiêu, mà là cách làm việc của AI đang thay đổi.

Claude bắt đầu thao tác trực tiếp vào hệ thống tệp của bạn.

GPT bắt đầu trò chuyện với bạn trong khi làm việc.

AI bắt đầu tham gia vào quá trình phát triển của chính nó.

Một năm trước, chúng ta vẫn đang thảo luận về việc AI có thể viết mã hay không.

Bây giờ, chúng ta đang thảo luận về việc AI có thể hoàn thành một dự án độc lập hay không.

Một năm nữa thì sao?

Tôi không biết câu trả lời.

Nhưng tôi biết một điều: Những người kiếm được tiền từ các công cụ AI, họ không phải là không biết những công cụ này sẽ bị thay thế.

Họ chỉ hiểu rõ: Mặc kệ nó có chết hay không, cứ dùng được thì cứ dùng đã.Đợi đến khi bạn "nghĩ thông suốt" thì lợi nhuận đã bị chia hết rồi.

Published in Technology

You Might Also Like

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạnTechnology

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn

Cách sử dụng công nghệ điện toán đám mây: Hướng dẫn đầy đủ để xây dựng cơ sở hạ tầng đám mây đầu tiên của bạn Giới thiệu...

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mấtTechnology

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất

Cảnh báo! Cha đẻ của Claude Code thẳng thắn: Một tháng nữa không dùng Plan Mode, danh hiệu kỹ sư phần mềm sẽ biến mất G...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõiTechnology

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi

Top 10 AI đại lý năm 2026: Phân tích điểm bán hàng cốt lõi Giới thiệu Với sự phát triển nhanh chóng của trí tuệ nhân tạo...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 Trong thời đại công nghệ phát triển nhanh chóng ngày nay, trí tuệ nhân tạo (AI) đã trở ...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 Trong lĩnh vực điện toán đám mây đang phát triển nhanh chóng, Amazon Web Services (AWS) luôn là ...