Claude Opus 4.6 + GPT-5.3 Codex:Aliran Kerja Dwi-Model Saya, Kecekapan Terus Berganda
Kawan-kawan yang berjaga malam menunggu model baharu dikeluarkan, adakah anda semua baik-baik sahaja?
Anthropic dan OpenAI mengeluarkan model utama masing-masing pada hari yang sama. Momen rakan-rakan telah dibanjiri dengan pelbagai perbandingan skor larian.
Tetapi hari ini saya tidak mahu bercakap tentang skor larian.
Saya ingin bercakap tentang: Apakah yang boleh anda peroleh daripada kemas kini ini?
🔥 Mari kita mulakan dengan perincian yang membuatkan saya berasa seram sejuk
Terdapat satu ayat dalam blog rasmi OpenAI:
"GPT-5.3-Codex ialah model pertama kami yang memainkan peranan penting dalam mencipta dirinya sendiri."
Apa maksudnya?
Pasukan OpenAI menggunakan versi awal Codex untuk menyahpepijat proses latihan, mengurus penggunaan, dan menganalisis hasil ujian semasa membangunkan GPT-5.3.
Mereka sendiri berkata bahawa mereka "terkejut dengan sejauh mana Codex boleh mempercepatkan pembangunan mereka sendiri".
AI mula mengambil bahagian dalam pembangunannya sendiri.
Ini mengingatkan saya tentang artikel Moutai yang saya tulis sebelum ini. Pada masa itu, saya berkata: "Tidak kira sama ada ia akan mati pada masa hadapan, jika kita boleh menggunakannya sekarang, mari kita mulakan."
Sekarang saya ingin berkata: Kelajuan evolusi AI mungkin lebih cepat daripada yang kita bayangkan.
Apabila anda "berfikir dengan jelas" dan kemudian bertindak, mungkin sudah terlambat.
💜 Claude Opus 4.6: Bukan Lebih Pintar, Tetapi Benar-benar Boleh Membantu Anda Bekerja
Kemas kini Anthropic kali ini mempunyai tajuk blog rasmi yang sangat menarik: "Memajukan kewangan dengan Claude Opus 4.6".
Mereka telah membuat pengoptimuman khusus untuk industri kewangan. Tetapi jangan tergesa-gesa untuk pergi, keupayaan ini juga berguna untuk kita.
🔧 Cowork: Akhirnya Boleh Mengendalikan Fail Tempatan Secara Langsung
Ini ialah ciri yang paling saya nantikan.
Dahulu, apabila menggunakan Claude, anda perlu menyalin dan menampal kandungan fail.
Sekarang dengan Cowork, anda boleh membenarkan Claude mengakses terus folder pada komputer anda, ia boleh membaca, mengedit, dan juga mencipta fail baharu.
Bayangkan: Anda memberikan folder draf reka bentuk kepadanya, dan biarkan ia membantu anda menyusun spesifikasi penamaan, menjana dokumen reka bentuk, dan juga memproses imej secara pukal.
Ini bukan masa depan, ini ialah ciri yang boleh digunakan sekarang.

📊 Claude dalam Excel dan PowerPoint
Anthropic memasukkan Claude terus ke dalam bar sisi Excel dan PowerPoint.
CTO Hebbia berkata: "Dahulu, ia mengambil masa beberapa jam untuk membuat PPT kewangan, tetapi kini ia boleh dilakukan dalam beberapa minit sahaja."
Ini adalah rahmat bagi kita yang membuat laporan produk dan cadangan reka bentuk.
Pengasas bersama Shortcut AI berkata: "Lompatan prestasi Opus 4.6 hampir tidak dapat dipercayai. Tugas yang Opus 4.5 dapati sukar sebelum ini, kini tiba-tiba menjadi mudah."
📈 Skor Larian dalam Bidang Kewangan
Data rasmi:
Penilaian Ejen Kewangan: 60.7% (peningkatan 5.47% berbanding Opus 4.5)
TaxEval: 76.0%
Penilaian Kewangan Dunia Sebenar: Peningkatan 23 mata peratusan berbanding Sonnet 4.5
Apakah maksud nombor ini? Claude sememangnya telah menjadi lebih kuat dalam mengendalikan tugas yang kompleks dan memerlukan penaakulan berbilang langkah.
💚 GPT-5.3 Codex: Cara Interaksi Telah Berubah, Ini Adalah Fokusnya
⚡ Kelajuan Meningkat sebanyak 25%, Tetapi yang Lebih Penting ialah Cara Interaksi Telah Berubah
Dahulu, apabila menggunakan Codex, anda perlu menunggu sehingga ia selesai berjalan untuk melihat hasilnya. Ingin menukar arah? Hentikan dan mulakan semula.
Sekarang ia berbeza.
GPT-5.3 Codex akan melaporkan kemajuan sambil berfungsi, dan anda boleh mencelah, bertanya soalan, dan melaraskan arah pada bila-bila masa tanpa kehilangan konteks.
Cara interaksi ini lebih seperti bekerjasama dengan rakan sekerja sebenar.

🌐 Peningkatan dalam Keupayaan Pembangunan Laman Web
Pegawai itu menunjukkan contoh: Biarkan GPT-5.3 Codex dan GPT-5.2 Codex masing-masing membuat halaman pendaratan SaaS.
Versi GPT-5.3:
✅ Menukar harga tahunan secara automatik kepada harga purata bulanan untuk menjadikan diskaun lebih intuitif
✅ Membuat komponen penilaian pengguna karusel automatik dengan tiga penilaian yang berbeza
✅ Secara keseluruhannya lebih seperti produk yang boleh dilancarkan secara langsung
Versi GPT-5.2 agak mudah dan memerlukan lebih banyak pelarasan manual.
Peningkatan dalam keupayaan "memahami niat pengguna" ini sangat praktikal untuk kita yang membuat prototaip dan membuat Demo.
🔐 Keselamatan Siber: Model Pertama yang Ditandakan sebagai "Keupayaan Tinggi"
Ramai orang tidak menyedari maklumat ini.
GPT-5.3 Codex ialah model pertama OpenAI yang diklasifikasikan sebagai model "Keupayaan Tinggi" dalam tugas keselamatan siber.
Mereka secara khusus melancarkan program Akses Dipercayai untuk Siber dan berjanji untuk melabur $10 juta dalam kredit API untuk menyokong penyelidikan pertahanan keselamatan siber.
Sempadan keupayaan AI berkembang pesat.
📊 Perbandingan Skor Larian: Masing-masing Mempunyai Kekuatan
Terminal-Bench 2.0 (Keupayaan Pengaturcaraan Terminal)
GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 Peningkatan: 13.3 mata peratusan
OSWorld-Verified (Keupayaan Mengendalikan Komputer)
GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 Peningkatan: 26.5 mata peratusan
Secara keseluruhannya, GPT-5.3 Codex telah meningkatkan operasi terminal dan keupayaan penggunaan komputer dengan ketara.

🍺 Logik Moutai: Apakah yang Boleh Anda Peroleh Sebelum Ia "Mati"?
Beberapa waktu lalu, saya menulis artikel yang menggunakan logik Duan Yongping untuk membeli Moutai untuk menjelaskan nilai alat AI.
Pandangan teras ialah:
Adakah Copilot akan digantikan? Mungkin.
Adakah Cursor mempunyai parit pertahanan? Ia sememangnya tidak dalam.
Adakah Claude Code bentuk muktamad? Pasti tidak.
Tetapi ini tidak penting.
Yang penting ialah: Berapa banyak dividen yang boleh anda peroleh daripadanya sebelum ia "mati"?
Sekarang Claude Opus 4.6 dan GPT-5.3 Codex telah tiba, soalan yang sama:
Adakah kedua-dua model ini akan digantikan? Pasti akan.
Adakah ia bentuk muktamad AI? Sudah tentu tidak.
Tetapi sebelum ia digantikan?
Sesetengah orang akan menggunakan Cowork untuk meningkatkan kecekapan dokumen reka bentuk sebanyak 10 kali ganda.
Sesetengah orang akan menggunakan Claude dalam Excel untuk memendekkan masa analisis data daripada sehari kepada satu jam.
Sesetengah orang akan menggunakan kerjasama interaktif GPT-5.3 Codex untuk menghasilkan SaaS yang lengkap dalam seminggu.
Bagaimana pula dengan anda? Masih menunggu "alat yang lebih baik" keluar?
🎯 Cadangan Pilihan Saya
Membuat cadangan reka bentuk, laporan produk, analisis data → Claude Opus 4.6
👉 Integrasi Cowork + Excel/PowerPoint lebih mesra untuk senario pejabat
Membuat pembangunan prototaip, menulis kod, menyahpepijat → GPT-5.3 Codex
👉 Keupayaan terminal yang kuat, pengalaman interaksi yang baik, kelajuan pantas
Menggunakan kedua-duanya → Ini ialah pilihan saya
👉 Claude melakukan penyelidikan dan dokumentasi awal, GPT melakukan pembangunan dan penyahpepijatan kemudian
Terdapat juga pertimbangan realistik: GPT lebih stabil untuk digunakan di China.

💰 Harga
Claude Opus 4.6
Input: $5 / juta token Output: $25 / juta token Melebihi 200,000 token konteks: $10 / $37.50
GPT-5.3 Codex
Harga API belum diumumkan Buat masa ini, gunakan melalui langganan ChatGPT Plus/Pro
✨ Kata Akhir
Apa yang paling saya rasai daripada kemas kini ini bukanlah berapa banyak skor larian telah meningkat, tetapi cara AI berfungsi sedang berubah.
Claude mula mengendalikan sistem fail anda secara langsung.
GPT mula berbual dengan anda sambil berfungsi.
AI mula mengambil bahagian dalam pembangunannya sendiri.
Setahun yang lalu, kami masih membincangkan sama ada AI boleh menulis kod.
Sekarang, kita sedang membincangkan sama ada AI boleh menyiapkan projek secara bebas.
Bagaimana pula dengan setahun lagi?
Saya tidak tahu jawapannya.
Tetapi saya tahu satu perkara: Mereka yang memperoleh wang dengan alat AI tidak tidak tahu bahawa alat ini akan digantikan.
Mereka hanya memikirkannya: Tidak kira sama ada ia akan mati pada masa hadapan, jika kita boleh menggunakannya sekarang, mari kita mulakan.Apabila Anda 'Berfikir Jernih', Bonus Sudah Dibahagi-bahagikan.





