Claude Opus 4.6 + GPT-5.3 Codex: 내 듀얼 모델 워크플로, 효율이 바로 두 배로

새벽까지 밤새워 새 모델 출시를 기다린 분들, 괜찮으신가요?

Anthropic과 OpenAI가 같은 날 각자의 플래그십 모델을 출시했습니다. 친구 목록은 이미 각종 벤치마크 비교로 도배되었죠.

하지만 오늘은 벤치마크에 대해 이야기하고 싶지 않습니다.

제가 이야기하고 싶은 것은: 이번 업데이트로 무엇을 얻을 수 있는가?입니다.

듀얼 모델 협업 워크플로 🔥 먼저 등골이 서늘해지는 디테일 하나

OpenAI 공식 블로그에 이런 문장이 있습니다.

「GPT-5.3-Codex는 우리 스스로를 창조하는 과정에서 중요한 역할을 한 최초의 모델입니다.」

무슨 뜻일까요?

OpenAI 팀은 GPT-5.3을 개발하는 과정에서 초기 버전의 Codex를 사용하여 훈련 과정 디버깅, 배포 관리, 테스트 결과 분석을 했습니다.

그들은 스스로도 「Codex가 자체 개발을 가속화하는 정도에 충격을 받았다」고 말합니다.

AI가 자체 개발에 참여하기 시작했습니다.

이것은 이전에 썼던 마오타이(중국 술) 글을 떠올리게 합니다. 당시 저는 「나중에 죽을지 어떨지 신경 쓰지 말고, 지금 쓸 수 있다면 먼저 써보자」고 말했습니다.

지금 저는 이렇게 말하고 싶습니다: AI 진화 속도는 우리가 상상하는 것보다 훨씬 빠를 수 있습니다.

당신이 「확실히 이해하고」 행동할 때쯤이면 이미 늦었을 수도 있습니다.

💜 Claude Opus 4.6: 더 똑똑한 것이 아니라, 실제로 당신의 일을 도와줄 수 있습니다

Anthropic의 이번 업데이트는 공식 블로그 제목이 매우 흥미롭습니다: 「Claude Opus 4.6으로 금융 발전시키기」.

그들은 특별히 금융 산업에 맞춰 최적화했습니다. 하지만 서둘러 넘기지 마세요. 이러한 능력은 우리에게도 유용합니다.

🔧 Cowork: 드디어 로컬 파일을 직접 조작할 수 있습니다

이것은 제가 가장 기대했던 기능입니다.

이전에는 Claude를 사용하려면 파일 내용을 복사하여 붙여넣어야 했습니다.

이제 Cowork가 있으면 Claude가 컴퓨터의 특정 폴더에 직접 액세스할 수 있으며, 읽고, 편집하고, 심지어 새 파일을 만들 수도 있습니다.

상상해 보세요: 디자인 초안 폴더를 Claude에게 주고, Claude가 명명 규칙을 정리하고, 디자인 문서를 생성하고, 심지어 이미지를 일괄 처리하도록 할 수 있습니다.

이것은 미래가 아니라 지금 바로 사용할 수 있는 기능입니다.

Cowork 기능

📊 Claude in Excel 및 PowerPoint

Anthropic은 Claude를 Excel 및 PowerPoint의 사이드바에 직접 넣었습니다.

Hebbia의 CTO는 「이전에는 금융 PPT를 만드는 데 몇 시간이 걸렸지만, 이제는 몇 분이면 끝낼 수 있습니다」라고 말합니다.

이것은 제품 보고서나 디자인 제안을 하는 사람들에게는 그야말로 축복입니다.

Shortcut AI의 공동 창립자는 「Opus 4.6의 성능 향상은 거의 믿을 수 없을 정도입니다. 이전에는 Opus 4.5가 어려워했던 작업이 이제 갑자기 쉬워졌습니다」라고 말합니다.

📈 금융 분야의 벤치마크

공식 데이터:

Finance Agent 평가: 60.7% (Opus 4.5보다 5.47% 향상)

TaxEval: 76.0%

Real-World Finance 평가: Sonnet 4.5보다 23% 포인트 향상

이러한 숫자는 무엇을 의미할까요? Claude는 복잡하고 여러 단계의 추론이 필요한 작업을 처리하는 데 확실히 강해졌습니다.

💚 GPT-5.3 Codex: 상호 작용 방식이 바뀌었습니다. 이것이 핵심입니다

⚡ 속도 25% 향상, 하지만 더 중요한 것은 상호 작용 방식이 바뀌었습니다

이전에는 Codex를 사용하려면 결과가 나올 때까지 기다려야 했습니다. 방향을 바꾸고 싶으세요? 중단하고 다시 시작해야 합니다.

이제는 다릅니다.

GPT-5.3 Codex는 작업하면서 진행 상황을 보고하고, 언제든지 끼어들어 질문하고, 방향을 조정할 수 있으며, 문맥을 잃지 않습니다.

이러한 상호 작용 방식은 실제 동료와 협력하는 것과 더 비슷합니다.

상호 작용 방식 비교

🌐 웹사이트 개발 능력 향상

공식적으로 제시된 예시: GPT-5.3 Codex와 GPT-5.2 Codex에게 각각 SaaS 랜딩 페이지를 만들도록 했습니다.

GPT-5.3 버전:

✅ 연간 가격을 월별 평균 가격으로 자동 변환하여 할인을 더 직관적으로 만듭니다.

✅ 세 가지 다른 평가가 있는 자동 회전 사용자 평가 구성 요소를 만들었습니다.

✅ 전체적으로 바로 출시할 수 있는 제품과 더 비슷합니다.

GPT-5.2 버전은 상대적으로 간단하며 더 많은 수동 조정이 필요합니다.

이러한 「사용자 의도 이해」 능력 향상은 프로토타입이나 데모를 만드는 사람들에게 매우 유용합니다.

🔐 사이버 보안: 최초로 「고성능」으로 분류된 모델

이 정보를 놓친 사람들이 많습니다.

GPT-5.3 Codex는 OpenAI에서 사이버 보안 작업에서 「High capability」로 분류된 최초의 모델입니다.

그들은 특별히 Trusted Access for Cyber 계획을 출시하고 사이버 보안 방어 연구를 지원하기 위해 1,000만 달러의 API 크레딧을 투자하겠다고 약속했습니다.

AI의 능력 경계가 빠르게 확장되고 있습니다.

📊 벤치마크 비교: 각자의 장점이 있습니다

Terminal-Bench 2.0 (터미널 프로그래밍 능력)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 향상 폭: 13.3% 포인트

OSWorld-Verified (컴퓨터 조작 능력)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 향상 폭: 26.5% 포인트

전반적으로 GPT-5.3 Codex는 터미널 조작 및 컴퓨터 사용 능력에서 큰 향상을 보였습니다.

벤치마크 비교

🍺 마오타이 논리: 그들이 「죽기」 전에 무엇을 얻을 수 있을까요?

얼마 전 저는 단용핑(段永平, 중국 투자자)이 마오타이를 구매한 논리를 사용하여 AI 도구의 가치를 설명하는 글을 썼습니다.

핵심 관점은 다음과 같습니다.

Copilot은 대체될까요? 그럴 수도 있습니다.

Cursor는 해자가 있을까요? 확실히 깊지 않습니다.

Claude Code는 궁극적인 형태일까요? 절대 아닙니다.

하지만 이러한 것들은 중요하지 않습니다.

중요한 것은: 그들이 「죽기」 전에 얼마나 많은 이익을 얻을 수 있는가?입니다.

이제 Claude Opus 4.6과 GPT-5.3 Codex가 왔습니다. 같은 질문입니다.

이 두 모델은 대체될까요? 분명히 대체될 것입니다.

그들은 AI의 궁극적인 형태일까요? 물론 아닙니다.

하지만 그들이 대체되기 전에는요?

누군가는 Cowork를 사용하여 디자인 문서 효율성을 10배 향상시킬 것입니다.

누군가는 Claude in Excel을 사용하여 데이터 분석 시간을 하루에서 한 시간으로 단축할 것입니다.

누군가는 GPT-5.3 Codex의 대화형 협업을 사용하여 일주일 만에 완전한 SaaS를 만들 것입니다.

당신은요? 아직 「더 나은 도구」가 나오기를 기다리고 있나요?

🎯 저의 선택 제안

디자인 제안, 제품 보고서, 데이터 분석 → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint 통합, 사무 환경에 더 친숙합니다.

프로토타입 개발, 코드 작성, 디버깅 → GPT-5.3 Codex

👉 터미널 능력이 강하고, 상호 작용 경험이 좋고, 속도가 빠릅니다.

둘 다 사용 → 이것이 저의 선택입니다.

👉 Claude는 초기 조사 및 문서 작성, GPT는 후기 개발 및 디버깅을 담당합니다.

또 다른 현실적인 고려 사항: GPT는 국내에서 사용하기 더 안정적입니다.

선택 제안

💰 가격

Claude Opus 4.6

입력: $5 / 백만 토큰 출력: $25 / 백만 토큰 20만 토큰 초과 컨텍스트: $10 / $37.50

GPT-5.3 Codex

API 가격은 아직 발표되지 않았습니다. 현재 ChatGPT Plus/Pro 구독을 통해 사용 가능합니다.

✨ 마지막으로

이번 업데이트에서 제가 가장 깊이 느낀 것은 벤치마크가 얼마나 향상되었는지가 아니라 AI의 작업 방식이 바뀌고 있다는 것입니다.

Claude는 파일 시스템을 직접 조작하기 시작합니다.

GPT는 작업하면서 당신과 대화하기 시작합니다.

AI는 자체 개발에 참여하기 시작합니다.

1년 전, 우리는 AI가 코드를 작성할 수 있는지 논의하고 있었습니다.

이제 우리는 AI가 프로젝트를 독립적으로 완료할 수 있는지 논의하고 있습니다.

1년 후에는요?

저는 답을 모릅니다.

하지만 저는 한 가지를 알고 있습니다: AI 도구를 사용하여 돈을 번 사람들은 이러한 도구가 대체될 것이라는 것을 모르는 것이 아닙니다.

그들은 단지 깨달았습니다: 나중에 죽을지 어떨지 신경 쓰지 말고, 지금 쓸 수 있다면 먼저 써보자. 네가 「생각을 확실히」 할 때를 기다리면, 이익은 이미 분할되어 끝났을 거야.

Claude Opus 4.6 + GPT-5.3 Codex: 내 듀얼 모델 워크플로, 효율이 바로 두 배로

💜 Claude Opus 4.6: 더 똑똑한 것이 아니라, 실제로 당신의 일을 도와줄 수 있습니다

🔧 Cowork: 드디어 로컬 파일을 직접 조작할 수 있습니다

📊 Claude in Excel 및 PowerPoint

📈 금융 분야의 벤치마크

💚 GPT-5.3 Codex: 상호 작용 방식이 바뀌었습니다. 이것이 핵심입니다

⚡ 속도 25% 향상, 하지만 더 중요한 것은 상호 작용 방식이 바뀌었습니다

🌐 웹사이트 개발 능력 향상

🔐 사이버 보안: 최초로 「고성능」으로 분류된 모델

📊 벤치마크 비교: 각자의 장점이 있습니다

🍺 마오타이 논리: 그들이 「죽기」 전에 무엇을 얻을 수 있을까요?

🎯 저의 선택 제안

💰 가격

✨ 마지막으로

You Might Also Like

Claude Code Buddy 수정 가이드: 어떻게 반짝이는 전설급 애완동물을 얻을 수 있을까

Obsidian이 Defuddle을 출시하여 Obsidian Web Clipper를 새로운 차원으로 끌어올리다

OpenAI가 갑자기 발표한 '삼합일': 브라우저 + 프로그래밍 + ChatGPT 통합, 내부에서 지난 1년이 잘못되었다고 인정하다

2026, 더 이상 스스로를 '자율'하게 강요하지 마세요! 이 8가지 작은 일을 잘하면 건강이 자연스럽게 찾아옵니다

노력해도 살이 빠지지 않는 엄마들, 여기서 모두 실패한다

AI 브라우저 24시간 안정적 운영 가이드