Qwen 3.5 출시: 397B 파라미터의 오픈 웨이트 모델, 비용 60% 절감

2/16/2026
3 min read

알리바바가 방금 Qwen 3.5-397B-A17B를 출시했습니다. 이는 Qwen 3.5 시리즈의 첫 번째 오픈 웨이트 모델입니다.

핵심 데이터

  • 총 파라미터: 397B
  • 활성화 파라미터: 17B per pass (희소 MoE)
  • 처리량: Qwen 3-Max 대비 8.6x-19x 향상
  • 비용: Qwen 3 대비 60% 절감
  • 언어 지원: 201개 (119개에서 확장)

이는 단순한 파라미터 스태킹이 아닙니다. 이는 효율성의 재정의입니다.

Qwen 3.5

아키텍처 혁신

Qwen 3.5는 혼합 아키텍처를 사용합니다.

  • Gated Delta Networks + 희소 MoE
  • 혼합 선형 어텐션: 대부분의 레이어는 선형 어텐션을 사용하고, 4개 레이어마다 전체 어텐션을 사용
  • 네이티브 멀티모달: 나중에 추가된 것이 아니라 처음부터 훈련

X에 기술 분석이 있습니다.

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

이 아키텍처의 의미는 17B 활성화 파라미터로 400B 모델에 가까운 성능을 구현하는 것입니다. 추론 비용이 크게 절감됩니다.

성능 주장

알리바바는 Qwen 3.5가 다음을 능가한다고 주장합니다.

  • GPT-5.2
  • Claude Opus 4.5
  • Gemini 3 Pro

X의 독립 테스터가 검증을 시작했습니다.

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

하지만 가장 중요한 것은 벤치마크가 아니라 에이전트 능력입니다.

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

에이전트 시대

Qwen 3.5의 포지셔닝은 명확합니다. 에이전트 시대를 위해 설계되었습니다.

  • 2시간 분량의 비디오 분석 가능
  • 독립적으로 앱 간 작업 실행 가능
  • GUI를 이해하고 상호 작용 가능

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

이는 '챗봇'이 아니라 '작업 실행기'라는 의미입니다.

경쟁 구도

X에서 이번 주 AI 출시를 요약했습니다.

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

중국 모델 제조업체의 리듬은 명확합니다.

  • DeepSeek V4
  • Qwen 3.5
  • GLM 5
  • MiniMax 2.5

매주 새로운 모델이 출시되고, 매번 GPT를 능가한다고 주장합니다. 이는 마케팅이 아니라 비용 전쟁의 업그레이드입니다.

비용 구조

Qwen 3.5의 토큰 가격은 Gemini 3 Pro의 1/18에 불과합니다.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

성능이 비슷하고 비용이 5%에 불과할 때, 폐쇄형 모델의 해자는 어디에 있을까요?

결론

Qwen 3.5는 '중국의 GPT'가 아닙니다. 이는 비용 구조의 파괴자입니다.

  1. 397B 파라미터, 하지만 17B만 활성화
  2. 오픈 웨이트, 로컬 배포 가능
  3. 에이전트 능력, 단순한 대화 이상
  4. 비용은 경쟁사의 5%에 불과

X에 흥미로운 예측이 있습니다.

"Qwen 3.5 Q4 버전은 225G만 필요하며, 실용적인 가치가 높습니다" — @janxin

225GB VRAM, 단일 시스템에서 실행 가능. 이는 중소 개발자가 처음으로 GPT-5 수준의 모델에 접근할 수 있음을 의미합니다.

진정한 문제는 Qwen 3.5가 GPT-5.3을 능가할 수 있는지 여부가 아니라 최고 수준 모델의 비용이 거의 0으로 떨어질 때 AI 회사는 어떻게 돈을 벌 수 있을까요?

Published in Technology

You Might Also Like

📝
Technology

Claude Code Buddy 수정 가이드: 어떻게 반짝이는 전설급 애완동물을 얻을 수 있을까

Claude Code Buddy 수정 가이드: 어떻게 반짝이는 전설급 애완동물을 얻을 수 있을까 2026년 4월 1일, Anthropic은 Claude Code 2.1.89 버전에서 조용히 이스터 에그 기능인 /bu...

Obsidian이 Defuddle을 출시하여 Obsidian Web Clipper를 새로운 차원으로 끌어올리다Technology

Obsidian이 Defuddle을 출시하여 Obsidian Web Clipper를 새로운 차원으로 끌어올리다

Obsidian이 Defuddle을 출시하여 Obsidian Web Clipper를 새로운 차원으로 끌어올리다 저는 Obsidian의 핵심 이념인 로컬 우선, 모든 것이 파일이라는 점, 그리고 단순한 Markdow...

OpenAI가 갑자기 발표한 '삼합일': 브라우저 + 프로그래밍 + ChatGPT 통합, 내부에서 지난 1년이 잘못되었다고 인정하다Technology

OpenAI가 갑자기 발표한 '삼합일': 브라우저 + 프로그래밍 + ChatGPT 통합, 내부에서 지난 1년이 잘못되었다고 인정하다

OpenAI가 갑자기 발표한 '삼합일': 브라우저 + 프로그래밍 + ChatGPT 통합, 내부에서 지난 1년이 잘못되었다고 인정하다 2026년 3월 19일 심야, OpenAI 본사에서 내부 메모가 유출되었고, 《월...

2026, 더 이상 스스로를 '자율'하게 강요하지 마세요! 이 8가지 작은 일을 잘하면 건강이 자연스럽게 찾아옵니다Health

2026, 더 이상 스스로를 '자율'하게 강요하지 마세요! 이 8가지 작은 일을 잘하면 건강이 자연스럽게 찾아옵니다

2026, 더 이상 스스로를 '자율'하게 강요하지 마세요! 이 8가지 작은 일을 잘하면 건강이 자연스럽게 찾아옵니다 새로운 한 해가 시작되었습니다. 작년에 세운 목표는 달성하셨나요? 매년 '의욕이 넘치'고 '포기하...

노력해도 살이 빠지지 않는 엄마들, 여기서 모두 실패한다Health

노력해도 살이 빠지지 않는 엄마들, 여기서 모두 실패한다

노력해도 살이 빠지지 않는 엄마들, 여기서 모두 실패한다 3월이 이미 반이 지났습니다. 당신의 다이어트 계획은 어떻게 되어가고 있나요? 살이 빠졌나요? 얼마나 빠졌나요? 나의 다이어트 경험 2월 말에 다이어트를 ...

📝
Technology

AI 브라우저 24시간 안정적 운영 가이드

AI 브라우저 24시간 안정적 운영 가이드 본 튜토리얼은 안정적이고 장기적으로 운영되는 AI 브라우저 환경을 구축하는 방법을 소개합니다. 적합한 용도 AI 에이전트 자동화 브라우징 웹 자동화 AI 어시스턴트 자동 테...