Qwen 3.5 출시: 397B 파라미터의 오픈 웨이트 모델, 비용 60% 절감

알리바바가 방금 Qwen 3.5-397B-A17B를 출시했습니다. 이는 Qwen 3.5 시리즈의 첫 번째 오픈 웨이트 모델입니다.

핵심 데이터

총 파라미터: 397B
활성화 파라미터: 17B per pass (희소 MoE)
처리량: Qwen 3-Max 대비 8.6x-19x 향상
비용: Qwen 3 대비 60% 절감
언어 지원: 201개 (119개에서 확장)

이는 단순한 파라미터 스태킹이 아닙니다. 이는 효율성의 재정의입니다.

Qwen 3.5

아키텍처 혁신

Qwen 3.5는 혼합 아키텍처를 사용합니다.

Gated Delta Networks + 희소 MoE
혼합 선형 어텐션: 대부분의 레이어는 선형 어텐션을 사용하고, 4개 레이어마다 전체 어텐션을 사용
네이티브 멀티모달: 나중에 추가된 것이 아니라 처음부터 훈련

X에 기술 분석이 있습니다.

"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen

이 아키텍처의 의미는 17B 활성화 파라미터로 400B 모델에 가까운 성능을 구현하는 것입니다. 추론 비용이 크게 절감됩니다.

성능 주장

알리바바는 Qwen 3.5가 다음을 능가한다고 주장합니다.

GPT-5.2
Claude Opus 4.5
Gemini 3 Pro

X의 독립 테스터가 검증을 시작했습니다.

"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme

하지만 가장 중요한 것은 벤치마크가 아니라 에이전트 능력입니다.

"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly

에이전트 시대

Qwen 3.5의 포지셔닝은 명확합니다. 에이전트 시대를 위해 설계되었습니다.

2시간 분량의 비디오 분석 가능
독립적으로 앱 간 작업 실행 가능
GUI를 이해하고 상호 작용 가능

"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly

이는 '챗봇'이 아니라 '작업 실행기'라는 의미입니다.

경쟁 구도

X에서 이번 주 AI 출시를 요약했습니다.

"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek

중국 모델 제조업체의 리듬은 명확합니다.

DeepSeek V4
Qwen 3.5
GLM 5
MiniMax 2.5

매주 새로운 모델이 출시되고, 매번 GPT를 능가한다고 주장합니다. 이는 마케팅이 아니라 비용 전쟁의 업그레이드입니다.

비용 구조

Qwen 3.5의 토큰 가격은 Gemini 3 Pro의 1/18에 불과합니다.

"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob

성능이 비슷하고 비용이 5%에 불과할 때, 폐쇄형 모델의 해자는 어디에 있을까요?

결론

Qwen 3.5는 '중국의 GPT'가 아닙니다. 이는 비용 구조의 파괴자입니다.

397B 파라미터, 하지만 17B만 활성화
오픈 웨이트, 로컬 배포 가능
에이전트 능력, 단순한 대화 이상
비용은 경쟁사의 5%에 불과

X에 흥미로운 예측이 있습니다.

"Qwen 3.5 Q4 버전은 225G만 필요하며, 실용적인 가치가 높습니다" — @janxin

225GB VRAM, 단일 시스템에서 실행 가능. 이는 중소 개발자가 처음으로 GPT-5 수준의 모델에 접근할 수 있음을 의미합니다.

진정한 문제는 Qwen 3.5가 GPT-5.3을 능가할 수 있는지 여부가 아니라 최고 수준 모델의 비용이 거의 0으로 떨어질 때 AI 회사는 어떻게 돈을 벌 수 있을까요?

Qwen 3.5 출시: 397B 파라미터의 오픈 웨이트 모델, 비용 60% 절감

핵심 데이터

아키텍처 혁신

성능 주장

에이전트 시대

경쟁 구도

비용 구조

결론

You Might Also Like

Claude Code Buddy 수정 가이드: 어떻게 반짝이는 전설급 애완동물을 얻을 수 있을까

Obsidian이 Defuddle을 출시하여 Obsidian Web Clipper를 새로운 차원으로 끌어올리다

OpenAI가 갑자기 발표한 '삼합일': 브라우저 + 프로그래밍 + ChatGPT 통합, 내부에서 지난 1년이 잘못되었다고 인정하다

2026, 더 이상 스스로를 '자율'하게 강요하지 마세요! 이 8가지 작은 일을 잘하면 건강이 자연스럽게 찾아옵니다

노력해도 살이 빠지지 않는 엄마들, 여기서 모두 실패한다

AI 브라우저 24시간 안정적 운영 가이드