Qwen 3.5 출시: 397B 파라미터의 오픈 웨이트 모델, 비용 60% 절감
알리바바가 방금 Qwen 3.5-397B-A17B를 출시했습니다. 이는 Qwen 3.5 시리즈의 첫 번째 오픈 웨이트 모델입니다.
핵심 데이터
- 총 파라미터: 397B
- 활성화 파라미터: 17B per pass (희소 MoE)
- 처리량: Qwen 3-Max 대비 8.6x-19x 향상
- 비용: Qwen 3 대비 60% 절감
- 언어 지원: 201개 (119개에서 확장)
이는 단순한 파라미터 스태킹이 아닙니다. 이는 효율성의 재정의입니다.

아키텍처 혁신
Qwen 3.5는 혼합 아키텍처를 사용합니다.
- Gated Delta Networks + 희소 MoE
- 혼합 선형 어텐션: 대부분의 레이어는 선형 어텐션을 사용하고, 4개 레이어마다 전체 어텐션을 사용
- 네이티브 멀티모달: 나중에 추가된 것이 아니라 처음부터 훈련
X에 기술 분석이 있습니다.
"Qwen3.5-397B-A17B: Hybrid linear attention + sparse MoE with large-scale RL environment scaling." — @Alibaba_Qwen
이 아키텍처의 의미는 17B 활성화 파라미터로 400B 모델에 가까운 성능을 구현하는 것입니다. 추론 비용이 크게 절감됩니다.
성능 주장
알리바바는 Qwen 3.5가 다음을 능가한다고 주장합니다.
- GPT-5.2
- Claude Opus 4.5
- Gemini 3 Pro
X의 독립 테스터가 검증을 시작했습니다.
"Qwen 3.5-397B dropped today... and the benchmarks are insane. Trading blows with Claude Opus 4.5 and GPT-5.2 across the board." — @antonpme
하지만 가장 중요한 것은 벤치마크가 아니라 에이전트 능력입니다.
"The agentic capabilities are the real story here. Qwen 3.5 can interact with GUIs, not just understand them. That's the unlock for workflows that touch existing software." — @thebuildrweekly
에이전트 시대
Qwen 3.5의 포지셔닝은 명확합니다. 에이전트 시대를 위해 설계되었습니다.
- 2시간 분량의 비디오 분석 가능
- 독립적으로 앱 간 작업 실행 가능
- GUI를 이해하고 상호 작용 가능
"Qwen 3.5 can independently take actions across apps." — @thebuildrweekly
이는 '챗봇'이 아니라 '작업 실행기'라는 의미입니다.
경쟁 구도
X에서 이번 주 AI 출시를 요약했습니다.
"This might be the single biggest week in AI history: DeepSeek V4, Gemini 3.1 Pro, GPT-5.3, Qwen 3.5, Claude Sonnet 5." — @HeyAbhishek
중국 모델 제조업체의 리듬은 명확합니다.
- DeepSeek V4
- Qwen 3.5
- GLM 5
- MiniMax 2.5
매주 새로운 모델이 출시되고, 매번 GPT를 능가한다고 주장합니다. 이는 마케팅이 아니라 비용 전쟁의 업그레이드입니다.
비용 구조
Qwen 3.5의 토큰 가격은 Gemini 3 Pro의 1/18에 불과합니다.
"Qwen 3.5 with performance comparable to Gemini 3, and a token price of only 1/18 of the latter." — @dyz_ob
성능이 비슷하고 비용이 5%에 불과할 때, 폐쇄형 모델의 해자는 어디에 있을까요?
결론
Qwen 3.5는 '중국의 GPT'가 아닙니다. 이는 비용 구조의 파괴자입니다.
- 397B 파라미터, 하지만 17B만 활성화
- 오픈 웨이트, 로컬 배포 가능
- 에이전트 능력, 단순한 대화 이상
- 비용은 경쟁사의 5%에 불과
X에 흥미로운 예측이 있습니다.
"Qwen 3.5 Q4 버전은 225G만 필요하며, 실용적인 가치가 높습니다" — @janxin
225GB VRAM, 단일 시스템에서 실행 가능. 이는 중소 개발자가 처음으로 GPT-5 수준의 모델에 접근할 수 있음을 의미합니다.
진정한 문제는 Qwen 3.5가 GPT-5.3을 능가할 수 있는지 여부가 아니라 최고 수준 모델의 비용이 거의 0으로 떨어질 때 AI 회사는 어떻게 돈을 벌 수 있을까요?





