Claude Opus 4.6 + GPT-5.3 Codex:私のデュアルモデルワークフロー、効率が直接倍増
夜更かしして新しいモデルのリリースを待っていた皆さん、お元気ですか?
AnthropicとOpenAIが同じ日にそれぞれのフラッグシップモデルを発表しました。タイムラインはすでに様々なベンチマーク比較で埋め尽くされています。
しかし、今日はベンチマークについて話したくありません。
私が話したいのは、今回のアップデートで何が得られるかということです。
🔥 まず、背筋が寒くなるような詳細から
OpenAIの公式ブログには、次のような一文があります。
「GPT-5.3-Codexは、私たち自身を創造する過程で重要な役割を果たした最初のモデルです。」
どういう意味でしょうか?
OpenAIのチームは、GPT-5.3を開発する過程で、初期バージョンのCodexを使ってトレーニングプロセスのデバッグ、デプロイメントの管理、テスト結果の分析を行いました。
彼ら自身も「Codexが自身の開発を加速させる程度に衝撃を受けた」と言っています。
AIが自身の開発に参加し始めたのです。
これは以前に書いた茅台酒の記事を思い出させます。当時、私は「将来どうなるかは分からないが、今使えるなら、まず使ってみよう」と言いました。
今、私は言いたい。「AIの進化のスピードは、私たちが想像するよりも速いかもしれない」と。
あなたが「よく考えて」から行動する頃には、もう手遅れになっているかもしれません。
💜 Claude Opus 4.6:より賢いだけでなく、本当に仕事を手伝ってくれる
Anthropicの今回のアップデートの公式ブログのタイトルは非常に興味深いです。「Claude Opus 4.6で金融を進化させる」。
彼らは特に金融業界向けに最適化を行いました。しかし、すぐにスクロールしないでください。これらの能力は私たちにとっても同様に役立ちます。
🔧 Cowork:ついにローカルファイルを直接操作できる
これは私が最も期待していた機能です。
以前はClaudeを使うには、ファイルの内容をコピー&ペーストする必要がありました。
Coworkがあれば、Claudeに自分のコンピュータ上の特定のフォルダに直接アクセスさせることができます。Claudeは、読み取り、編集、さらには新しいファイルを作成することもできます。
想像してみてください。デザインのフォルダをClaudeに与え、命名規則の整理、デザインドキュメントの生成、さらには画像のバッチ処理を手伝わせることができます。
これは未来の話ではなく、今すぐ使える機能です。

📊 Claude in ExcelとPowerPoint
AnthropicはClaudeをExcelとPowerPointのサイドバーに直接組み込みました。
HebbiaのCTOは、「以前は金融PPTを作成するのに数時間かかっていたが、今では数分で完了する」と言っています。
これは、製品レポートやデザイン提案を行う私たちにとって、まさに福音です。
Shortcut AIの共同創設者は、「Opus 4.6のパフォーマンスの飛躍はほとんど信じられないほどです。以前はOpus 4.5が困難だと感じていたタスクが、今では突然簡単になりました」と言っています。
📈 金融分野のベンチマーク
公式データ:
Finance Agent評価:60.7%(Opus 4.5より5.47%向上)
TaxEval:76.0%
Real-World Finance評価:Sonnet 4.5より23パーセントポイント向上
これらの数字は何を意味するのでしょうか?Claudeは、複雑で、複数のステップの推論を必要とするタスクの処理において、確かに強力になっています。
💚 GPT-5.3 Codex:インタラクション方法が変わった、これが重要
⚡ 速度が25%向上したが、より重要なのはインタラクション方法が変わったこと
以前のCodexでは、結果を見るために実行が完了するのを待つ必要がありました。方向を変えたい?停止してやり直す。
今は違います。
GPT-5.3 Codexは、作業中に進捗状況を報告し、いつでも割り込み、質問、方向を調整でき、コンテキストが失われることはありません。
このインタラクション方法は、まるで本物の同僚と協力しているかのようです。

🌐 ウェブサイト開発能力の向上
公式は、GPT-5.3 CodexとGPT-5.2 CodexにそれぞれSaaSランディングページを作成させる例を示しました。
GPT-5.3のバージョン:
✅ 年間料金を自動的に月額料金に換算し、割引をより直感的に表示
✅ 3つの異なるレビューを含む自動ローリングユーザーレビューコンポーネントを作成
✅ 全体的に、すぐに公開できる製品に近い
GPT-5.2のバージョンは比較的シンプルで、より多くの手動調整が必要です。
この「ユーザーの意図を理解する」能力の向上は、プロトタイプやデモを作成する私たちにとって非常に実用的です。
🔐 ネットワークセキュリティ:最初に「高能力」と評価されたモデル
この情報に気づいていない人が多いです。
GPT-5.3 Codexは、OpenAIで最初にネットワークセキュリティタスクで「High capability」に分類されたモデルです。
彼らは特別にTrusted Access for Cyberプログラムを開始し、ネットワークセキュリティ防御研究をサポートするために1000万ドルのAPIクレジットを投入することを約束しました。
AIの能力の境界は急速に拡大しています。
📊 ベンチマーク比較:それぞれに長所がある
Terminal-Bench 2.0(ターミナルプログラミング能力)
GPT-5.3 Codex:77.3% GPT-5.2 Codex:64.0% 📈 向上幅:13.3パーセントポイント
OSWorld-Verified(コンピュータ操作能力)
GPT-5.3 Codex:64.7% GPT-5.2 Codex:38.2% 📈 向上幅:26.5パーセントポイント
全体的に見て、GPT-5.3 Codexはターミナル操作とコンピュータ使用能力が大幅に向上しています。

🍺 茅台酒ロジック:「死ぬ」前に、何が得られるか?
先日、私は段永平が茅台酒を買うロジックを使ってAIツールの価値を説明する記事を書きました。
核心的な見解は次のとおりです。
Copilotは置き換えられますか?そうかもしれません。
Cursorに堀はありますか?確かに深くはありません。
Claude Codeは究極の形ですか?絶対に違います。
しかし、これらはすべて重要ではありません。
重要なのは、それらが「死ぬ」前に、どれだけの恩恵を受けられるかということです。
今、Claude Opus 4.6とGPT-5.3 Codexが登場しました。同じ質問です。
これらの2つのモデルは置き換えられますか?間違いなく置き換えられます。
これらはAIの究極の形ですか?もちろん違います。
しかし、それらが置き換えられる前に?
Coworkを使ってデザインドキュメントの効率を10倍に向上させる人がいます。
Claude in Excelを使ってデータ分析の時間を1日から1時間に短縮する人がいます。
GPT-5.3 Codexのインタラクティブなコラボレーションを使って、1週間で完全なSaaSを構築する人がいます。
あなたは?まだ「より良いツール」が出てくるのを待っていますか?
🎯 私の選択に関するアドバイス
デザイン提案、製品レポート、データ分析を行う → Claude Opus 4.6
👉 Cowork + Excel/PowerPointの統合は、オフィスシーンに適しています
プロトタイプ開発、コーディング、デバッグを行う → GPT-5.3 Codex
👉 ターミナル能力が高く、インタラクション体験が良く、高速
両方使う → これが私の選択
👉 Claudeで初期調査とドキュメント作成を行い、GPTで後期開発とデバッグを行う
もう1つ現実的な考慮事項:GPTは国内での使用がより安定しています。

💰 価格
Claude Opus 4.6
入力:$5 / 100万トークン 出力:$25 / 100万トークン 20万トークンを超えるコンテキスト:$10 / $37.50
GPT-5.3 Codex
API価格はまだ発表されていません 現在、ChatGPT Plus/Proサブスクリプションで使用
✨ 最後に
今回のアップデートで私が最も深く感じたのは、ベンチマークがどれだけ向上したかではなく、AIの働き方が変化していることです。
Claudeはファイルシステムを直接操作し始めました。
GPTは作業中にあなたと対話し始めました。
AIは自身の開発に参加し始めました。
1年前、私たちはAIがコードを書けるかどうかを議論していました。
今、私たちはAIが単独でプロジェクトを完了できるかどうかを議論しています。
さらに1年後?
私には答えが分かりません。
しかし、私は1つのことを知っています。AIツールを使ってお金を稼いだ人々は、これらのツールが置き換えられることを知らないわけではありません。
彼らはただ、将来どうなるかは分からないが、今使えるなら、まず使ってみようと考えているだけです。等你「想清楚」的时候,红利已经被瓜分完了。





