LLM은 다음 JPEG이다
이야기 하나를 해 드리겠습니다.
1990년대에 사진을 다른 사람에게 보내려면 파일 형식, 압축 알고리즘, 색상 심도 등 많은 것을 고려해야 했습니다. 각 소프트웨어마다 자체 형식이 있었습니다. 그러다 JPEG가 등장했습니다.
갑자기 아무도 이미지 형식에 신경 쓰지 않게 되었습니다. JPEG는 인프라가 되었습니다. "JPEG로 그림을 만들었다"고 말하지 않고, 그냥 "사진을 보냈다"고 말합니다.
LLM도 같은 길을 걷고 있습니다.
기술이 공기가 될 때
"LLM은 상품입니다. Apple은 LLM 회사에서 토큰을 기꺼이 구매하겠지만, Apple은 차별화된 제품을 판매하는 회사입니다." — @deuteronormative
이 말은 직설적입니다. 만약 당신이 Apple이라면, 직접 발전하지 않고 전력망에서 전기를 구매할 것입니다. 직접 타이어를 만들지 않고 미쉐린에서 타이어를 구매할 것입니다. 이제 LLM을 직접 훈련하지 않고 클라우드에서 토큰을 구매할 것입니다.
이것은 LLM이 중요하지 않다는 의미가 아닙니다. 전기는 중요합니다. 타이어는 중요합니다. 하지만 그것들은 인프라이고, 차별화 요소가 아닙니다.
비용 전쟁의 승자
알리바바가 막 출시한 Qwen 3.5:
- 3970억 개의 파라미터, 170억 개의 활성
- Qwen 3보다 60% 저렴
- 8배 빠른 속도
- 토큰 가격은 Gemini 3 Pro의 1/18
이것은 기술적 돌파구가 아니라 가격 전쟁입니다. 과거 LCD TV도 이런 식으로 가격이 내려갔습니다. 처음으로 1000달러 이하로 가격을 낮춘 기업은 기술이 가장 좋은 기업이 아니었지만, 승자였습니다.
실용주의적 조언
만약 당신이 개발자라면, 이것은 무엇을 의미할까요?
-
모델을 직접 훈련하지 마세요. OpenAI, Anthropic 또는 알리바바가 아니라면 모델을 훈련하는 것은 돈 낭비입니다. API를 사용하세요.
-
파라미터가 아닌 가격에 집중하세요. 3970억 개의 파라미터는 멋지게 들리지만, 당신의 사용자는 신경 쓰지 않습니다. 그들은 응답 속도와 비용에 신경 씁니다.
-
마이그레이션할 준비를 하세요. LLM은 상품이므로 대체 가능합니다. 오늘은 GPT를 사용하고, 내일은 Claude를 사용하고, 모레는 Qwen을 사용하세요. 당신의 아키텍처는 이러한 전환을 지원해야 합니다.
흥미로운 역설
LLM을 가장 잘 아는 사람들은 오히려 LLM에 대해 별로 이야기하지 않습니다.
"Andrej Karpathy는 240줄의 순수 Python으로 미니 GPT를 작성했습니다. TensorFlow도 없고, PyTorch도 없습니다. 오직 수학뿐입니다. 이것은 LLM이 마법이 아니라, 단지 다음 토큰 예측일 뿐임을 보여줍니다."
"다음 토큰 예측"이 이 기술의 전부라는 것을 이해하면, 많은 과장 광고가 사라집니다. 이것은 폄하하는 것이 아닙니다. 전자레인지는 물 분자를 가열할 뿐이지만, 부엌을 바꾸었습니다.
다음 단계
LLM은 JPEG와 같은 것이 될 것입니다. 어디에나 있고, 아무도 이야기하지 않지만, 필수 불가결한 것.
그때까지, 현명한 사람들은 가격 전쟁에서 가장 저렴한 공급업체를 선택할 것입니다. 기술이 상품화되면 유일하게 중요한 것은 비용이기 때문입니다.





