LLM은 다음 JPEG이다

이야기 하나를 해 드리겠습니다.

1990년대에 사진을 다른 사람에게 보내려면 파일 형식, 압축 알고리즘, 색상 심도 등 많은 것을 고려해야 했습니다. 각 소프트웨어마다 자체 형식이 있었습니다. 그러다 JPEG가 등장했습니다.

갑자기 아무도 이미지 형식에 신경 쓰지 않게 되었습니다. JPEG는 인프라가 되었습니다. "JPEG로 그림을 만들었다"고 말하지 않고, 그냥 "사진을 보냈다"고 말합니다.

LLM도 같은 길을 걷고 있습니다.

기술이 공기가 될 때

"LLM은 상품입니다. Apple은 LLM 회사에서 토큰을 기꺼이 구매하겠지만, Apple은 차별화된 제품을 판매하는 회사입니다." — @deuteronormative

이 말은 직설적입니다. 만약 당신이 Apple이라면, 직접 발전하지 않고 전력망에서 전기를 구매할 것입니다. 직접 타이어를 만들지 않고 미쉐린에서 타이어를 구매할 것입니다. 이제 LLM을 직접 훈련하지 않고 클라우드에서 토큰을 구매할 것입니다.

이것은 LLM이 중요하지 않다는 의미가 아닙니다. 전기는 중요합니다. 타이어는 중요합니다. 하지만 그것들은 인프라이고, 차별화 요소가 아닙니다.

알리바바가 막 출시한 Qwen 3.5:

이것은 기술적 돌파구가 아니라 가격 전쟁입니다. 과거 LCD TV도 이런 식으로 가격이 내려갔습니다. 처음으로 1000달러 이하로 가격을 낮춘 기업은 기술이 가장 좋은 기업이 아니었지만, 승자였습니다.

만약 당신이 개발자라면, 이것은 무엇을 의미할까요?

모델을 직접 훈련하지 마세요. OpenAI, Anthropic 또는 알리바바가 아니라면 모델을 훈련하는 것은 돈 낭비입니다. API를 사용하세요.
파라미터가 아닌 가격에 집중하세요. 3970억 개의 파라미터는 멋지게 들리지만, 당신의 사용자는 신경 쓰지 않습니다. 그들은 응답 속도와 비용에 신경 씁니다.
마이그레이션할 준비를 하세요. LLM은 상품이므로 대체 가능합니다. 오늘은 GPT를 사용하고, 내일은 Claude를 사용하고, 모레는 Qwen을 사용하세요. 당신의 아키텍처는 이러한 전환을 지원해야 합니다.