Claude Opus 4.6 + GPT-5.3 Codex: 내 듀얼 모델 워크플로, 효율이 바로 두 배로

2/13/2026
5 min read

새벽까지 밤새워 새 모델 출시를 기다린 분들, 괜찮으신가요?

Anthropic과 OpenAI가 같은 날 각자의 플래그십 모델을 출시했습니다. 친구 목록은 이미 각종 벤치마크 비교로 도배되었죠.

하지만 오늘은 벤치마크에 대해 이야기하고 싶지 않습니다.

제가 이야기하고 싶은 것은: 이번 업데이트로 무엇을 얻을 수 있는가?입니다.

듀얼 모델 협업 워크플로🔥 먼저 등골이 서늘해지는 디테일 하나

OpenAI 공식 블로그에 이런 문장이 있습니다.

「GPT-5.3-Codex는 우리 스스로를 창조하는 과정에서 중요한 역할을 한 최초의 모델입니다.」

무슨 뜻일까요?

OpenAI 팀은 GPT-5.3을 개발하는 과정에서 초기 버전의 Codex를 사용하여 훈련 과정 디버깅, 배포 관리, 테스트 결과 분석을 했습니다.

그들은 스스로도 「Codex가 자체 개발을 가속화하는 정도에 충격을 받았다」고 말합니다.

AI가 자체 개발에 참여하기 시작했습니다.

이것은 이전에 썼던 마오타이(중국 술) 글을 떠올리게 합니다. 당시 저는 「나중에 죽을지 어떨지 신경 쓰지 말고, 지금 쓸 수 있다면 먼저 써보자」고 말했습니다.

지금 저는 이렇게 말하고 싶습니다: AI 진화 속도는 우리가 상상하는 것보다 훨씬 빠를 수 있습니다.

당신이 「확실히 이해하고」 행동할 때쯤이면 이미 늦었을 수도 있습니다.

💜 Claude Opus 4.6: 더 똑똑한 것이 아니라, 실제로 당신의 일을 도와줄 수 있습니다

Anthropic의 이번 업데이트는 공식 블로그 제목이 매우 흥미롭습니다: 「Claude Opus 4.6으로 금융 발전시키기」.

그들은 특별히 금융 산업에 맞춰 최적화했습니다. 하지만 서둘러 넘기지 마세요. 이러한 능력은 우리에게도 유용합니다.

🔧 Cowork: 드디어 로컬 파일을 직접 조작할 수 있습니다

이것은 제가 가장 기대했던 기능입니다.

이전에는 Claude를 사용하려면 파일 내용을 복사하여 붙여넣어야 했습니다.

이제 Cowork가 있으면 Claude가 컴퓨터의 특정 폴더에 직접 액세스할 수 있으며, 읽고, 편집하고, 심지어 새 파일을 만들 수도 있습니다.

상상해 보세요: 디자인 초안 폴더를 Claude에게 주고, Claude가 명명 규칙을 정리하고, 디자인 문서를 생성하고, 심지어 이미지를 일괄 처리하도록 할 수 있습니다.

이것은 미래가 아니라 지금 바로 사용할 수 있는 기능입니다.

Cowork 기능

📊 Claude in Excel 및 PowerPoint

Anthropic은 Claude를 Excel 및 PowerPoint의 사이드바에 직접 넣었습니다.

Hebbia의 CTO는 「이전에는 금융 PPT를 만드는 데 몇 시간이 걸렸지만, 이제는 몇 분이면 끝낼 수 있습니다」라고 말합니다.

이것은 제품 보고서나 디자인 제안을 하는 사람들에게는 그야말로 축복입니다.

Shortcut AI의 공동 창립자는 「Opus 4.6의 성능 향상은 거의 믿을 수 없을 정도입니다. 이전에는 Opus 4.5가 어려워했던 작업이 이제 갑자기 쉬워졌습니다」라고 말합니다.

📈 금융 분야의 벤치마크

공식 데이터:

Finance Agent 평가: 60.7% (Opus 4.5보다 5.47% 향상)

TaxEval: 76.0%

Real-World Finance 평가: Sonnet 4.5보다 23% 포인트 향상

이러한 숫자는 무엇을 의미할까요? Claude는 복잡하고 여러 단계의 추론이 필요한 작업을 처리하는 데 확실히 강해졌습니다.

💚 GPT-5.3 Codex: 상호 작용 방식이 바뀌었습니다. 이것이 핵심입니다

⚡ 속도 25% 향상, 하지만 더 중요한 것은 상호 작용 방식이 바뀌었습니다

이전에는 Codex를 사용하려면 결과가 나올 때까지 기다려야 했습니다. 방향을 바꾸고 싶으세요? 중단하고 다시 시작해야 합니다.

이제는 다릅니다.

GPT-5.3 Codex는 작업하면서 진행 상황을 보고하고, 언제든지 끼어들어 질문하고, 방향을 조정할 수 있으며, 문맥을 잃지 않습니다.

이러한 상호 작용 방식은 실제 동료와 협력하는 것과 더 비슷합니다.

상호 작용 방식 비교

🌐 웹사이트 개발 능력 향상

공식적으로 제시된 예시: GPT-5.3 Codex와 GPT-5.2 Codex에게 각각 SaaS 랜딩 페이지를 만들도록 했습니다.

GPT-5.3 버전:

✅ 연간 가격을 월별 평균 가격으로 자동 변환하여 할인을 더 직관적으로 만듭니다.

✅ 세 가지 다른 평가가 있는 자동 회전 사용자 평가 구성 요소를 만들었습니다.

✅ 전체적으로 바로 출시할 수 있는 제품과 더 비슷합니다.

GPT-5.2 버전은 상대적으로 간단하며 더 많은 수동 조정이 필요합니다.

이러한 「사용자 의도 이해」 능력 향상은 프로토타입이나 데모를 만드는 사람들에게 매우 유용합니다.

🔐 사이버 보안: 최초로 「고성능」으로 분류된 모델

이 정보를 놓친 사람들이 많습니다.

GPT-5.3 Codex는 OpenAI에서 사이버 보안 작업에서 「High capability」로 분류된 최초의 모델입니다.

그들은 특별히 Trusted Access for Cyber 계획을 출시하고 사이버 보안 방어 연구를 지원하기 위해 1,000만 달러의 API 크레딧을 투자하겠다고 약속했습니다.

AI의 능력 경계가 빠르게 확장되고 있습니다.

📊 벤치마크 비교: 각자의 장점이 있습니다

Terminal-Bench 2.0 (터미널 프로그래밍 능력)

GPT-5.3 Codex: 77.3% GPT-5.2 Codex: 64.0% 📈 향상 폭: 13.3% 포인트

OSWorld-Verified (컴퓨터 조작 능력)

GPT-5.3 Codex: 64.7% GPT-5.2 Codex: 38.2% 📈 향상 폭: 26.5% 포인트

전반적으로 GPT-5.3 Codex는 터미널 조작 및 컴퓨터 사용 능력에서 큰 향상을 보였습니다.

벤치마크 비교

🍺 마오타이 논리: 그들이 「죽기」 전에 무엇을 얻을 수 있을까요?

얼마 전 저는 단용핑(段永平, 중국 투자자)이 마오타이를 구매한 논리를 사용하여 AI 도구의 가치를 설명하는 글을 썼습니다.

핵심 관점은 다음과 같습니다.

Copilot은 대체될까요? 그럴 수도 있습니다.

Cursor는 해자가 있을까요? 확실히 깊지 않습니다.

Claude Code는 궁극적인 형태일까요? 절대 아닙니다.

하지만 이러한 것들은 중요하지 않습니다.

중요한 것은: 그들이 「죽기」 전에 얼마나 많은 이익을 얻을 수 있는가?입니다.

이제 Claude Opus 4.6과 GPT-5.3 Codex가 왔습니다. 같은 질문입니다.

이 두 모델은 대체될까요? 분명히 대체될 것입니다.

그들은 AI의 궁극적인 형태일까요? 물론 아닙니다.

하지만 그들이 대체되기 전에는요?

누군가는 Cowork를 사용하여 디자인 문서 효율성을 10배 향상시킬 것입니다.

누군가는 Claude in Excel을 사용하여 데이터 분석 시간을 하루에서 한 시간으로 단축할 것입니다.

누군가는 GPT-5.3 Codex의 대화형 협업을 사용하여 일주일 만에 완전한 SaaS를 만들 것입니다.

당신은요? 아직 「더 나은 도구」가 나오기를 기다리고 있나요?

🎯 저의 선택 제안

디자인 제안, 제품 보고서, 데이터 분석 → Claude Opus 4.6

👉 Cowork + Excel/PowerPoint 통합, 사무 환경에 더 친숙합니다.

프로토타입 개발, 코드 작성, 디버깅 → GPT-5.3 Codex

👉 터미널 능력이 강하고, 상호 작용 경험이 좋고, 속도가 빠릅니다.

둘 다 사용 → 이것이 저의 선택입니다.

👉 Claude는 초기 조사 및 문서 작성, GPT는 후기 개발 및 디버깅을 담당합니다.

또 다른 현실적인 고려 사항: GPT는 국내에서 사용하기 더 안정적입니다.

선택 제안

💰 가격

Claude Opus 4.6

입력: $5 / 백만 토큰 출력: $25 / 백만 토큰 20만 토큰 초과 컨텍스트: $10 / $37.50

GPT-5.3 Codex

API 가격은 아직 발표되지 않았습니다. 현재 ChatGPT Plus/Pro 구독을 통해 사용 가능합니다.

✨ 마지막으로

이번 업데이트에서 제가 가장 깊이 느낀 것은 벤치마크가 얼마나 향상되었는지가 아니라 AI의 작업 방식이 바뀌고 있다는 것입니다.

Claude는 파일 시스템을 직접 조작하기 시작합니다.

GPT는 작업하면서 당신과 대화하기 시작합니다.

AI는 자체 개발에 참여하기 시작합니다.

1년 전, 우리는 AI가 코드를 작성할 수 있는지 논의하고 있었습니다.

이제 우리는 AI가 프로젝트를 독립적으로 완료할 수 있는지 논의하고 있습니다.

1년 후에는요?

저는 답을 모릅니다.

하지만 저는 한 가지를 알고 있습니다: AI 도구를 사용하여 돈을 번 사람들은 이러한 도구가 대체될 것이라는 것을 모르는 것이 아닙니다.

그들은 단지 깨달았습니다: 나중에 죽을지 어떨지 신경 쓰지 말고, 지금 쓸 수 있다면 먼저 써보자. 네가 「생각을 확실히」 할 때를 기다리면, 이익은 이미 분할되어 끝났을 거야.

Published in Technology

You Might Also Like

클라우드 컴퓨팅 기술 사용 방법: 첫 번째 클라우드 인프라 구축 완벽 가이드Technology

클라우드 컴퓨팅 기술 사용 방법: 첫 번째 클라우드 인프라 구축 완벽 가이드

클라우드 컴퓨팅 기술 사용 방법: 첫 번째 클라우드 인프라 구축 완벽 가이드 서론 디지털 전환이 가속화됨에 따라 클라우드 컴퓨팅은 기업과 개발자들이 선호하는 솔루션이 되었습니다. 클라우드 컴퓨팅을 통해 사용자는 애플...

경고! Claude Code의 아버지, 1개월 후 Plan Mode를 사용하지 않으면 소프트웨어 엔지니어 직함이 사라질 것이라고 단언하다Technology

경고! Claude Code의 아버지, 1개월 후 Plan Mode를 사용하지 않으면 소프트웨어 엔지니어 직함이 사라질 것이라고 단언하다

경고! Claude Code의 아버지, 1개월 후 Plan Mode를 사용하지 않으면 소프트웨어 엔지니어 직함이 사라질 것이라고 단언하다 최근 YC의 원탁 인터뷰가 기술계에서 화제가 되었습니다——Claude Cod...

2026년 Top 10 심층 학습 자원 추천Technology

2026년 Top 10 심층 학습 자원 추천

2026년 Top 10 심층 학습 자원 추천 심층 학습이 다양한 분야에서 빠르게 발전함에 따라, 점점 더 많은 학습 자원과 도구가 등장하고 있습니다. 본문에서는 2026년 가장 주목할 만한 10개의 심층 학습 자원을...

2026년 Top 10 AI 에이전트: 핵심 판매 포인트 분석Technology

2026년 Top 10 AI 에이전트: 핵심 판매 포인트 분석

2026년 Top 10 AI 에이전트: 핵심 판매 포인트 분석 서론 인공지능의 빠른 발전과 함께 AI 에이전트(AI Agents)는 기술 분야의 핫 이슈가 되었습니다. 점점 더 많은 개발자와 기업들이 이러한 스마트 ...

2026년 Top 10 AI 도구 추천: 인공지능의 진정한 잠재력 발휘하기Technology

2026년 Top 10 AI 도구 추천: 인공지능의 진정한 잠재력 발휘하기

2026년 Top 10 AI 도구 추천: 인공지능의 진정한 잠재력 발휘하기 기술이 빠르게 발전하는 오늘날, 인공지능(AI)은 각 산업에서 인기 있는 주제가 되었습니다. 의료 건강에서 금융 서비스, 교육에서 엔터테인먼...

2026년 Top 10 AWS 도구 및 리소스 추천Technology

2026년 Top 10 AWS 도구 및 리소스 추천

2026년 Top 10 AWS 도구 및 리소스 추천 빠르게 발전하는 클라우드 컴퓨팅 분야에서 Amazon Web Services (AWS)는 선두주자로서 풍부한 서비스와 도구를 제공하여 개발자, 기업 및 기술 전문가...