LLM Là JPEG Tiếp Theo
Hãy để tôi kể một câu chuyện.
Trong những năm 1990, nếu bạn muốn gửi một bức ảnh cho người khác, bạn cần phải cân nhắc rất nhiều: định dạng tệp, thuật toán nén, độ sâu màu. Mỗi phần mềm đều có định dạng riêng. Sau đó JPEG xuất hiện.
Đột nhiên, không ai còn quan tâm đến định dạng ảnh nữa. JPEG trở thành cơ sở hạ tầng. Bạn sẽ không nói "Tôi đã tạo một bức ảnh bằng JPEG", bạn chỉ nói "Tôi đã gửi một bức ảnh".
LLM đang đi trên con đường tương tự.
Khi Công Nghệ Trở Thành Không Khí
"LLM là hàng hóa. Apple rất vui khi mua token từ các công ty LLM, nhưng Apple là một công ty bán các sản phẩm khác biệt." — @deuteronormative
Câu nói này rất thẳng thắn. Nếu bạn là Apple, bạn sẽ không tự phát điện, bạn mua điện từ lưới điện. Bạn sẽ không tự sản xuất lốp xe, bạn mua lốp xe từ Michelin. Bây giờ, bạn cũng sẽ không tự huấn luyện LLM, bạn mua token từ đám mây.
Điều này không có nghĩa là LLM không quan trọng. Điện rất quan trọng. Lốp xe rất quan trọng. Nhưng chúng là cơ sở hạ tầng, không phải là yếu tố tạo nên sự khác biệt.
Người Chiến Thắng Trong Cuộc Chiến Chi Phí
Qwen 3.5 vừa được Alibaba phát hành:
- 397 tỷ tham số, 17 tỷ kích hoạt
- Rẻ hơn 60% so với Qwen 3
- Nhanh hơn 8 lần
- Giá Token bằng 1/18 so với Gemini 3 Pro
Đây không phải là một đột phá về công nghệ, đây là một cuộc chiến về giá. TV LCD cũng đã giảm giá theo cách này. Doanh nghiệp đầu tiên giảm xuống dưới 1000 đô la không phải là doanh nghiệp có công nghệ tốt nhất, nhưng nó là người chiến thắng.
Lời Khuyên Thực Tế
Nếu bạn là nhà phát triển, điều này có nghĩa là gì?
-
Đừng tự huấn luyện mô hình. Trừ khi bạn là OpenAI, Anthropic hoặc Alibaba, nếu không việc huấn luyện mô hình là đốt tiền. Hãy sử dụng API.
-
Tập trung vào giá hơn là tham số. 397 tỷ tham số nghe có vẻ круто, nhưng người dùng của bạn không quan tâm. Họ quan tâm đến tốc độ phản hồi và chi phí.
-
Hãy sẵn sàng di chuyển. LLM là hàng hóa, có nghĩa là có thể thay thế được. Hôm nay dùng GPT, ngày mai dùng Claude, ngày kia dùng Qwen. Kiến trúc của bạn nên hỗ trợ việc chuyển đổi này.
Nghịch Lý Thú Vị
Những người hiểu rõ nhất về LLM lại ít nói về LLM nhất.
"Andrej Karpathy đã viết một mini GPT bằng 240 dòng Python thuần túy. Không có TensorFlow. Không có PyTorch. Chỉ có toán học. Nó cho thấy LLM không phải là phép thuật - chúng chỉ là dự đoán token tiếp theo."
Khi bạn hiểu rằng "dự đoán token tiếp theo" là tất cả về công nghệ này, rất nhiều sự cường điệu sẽ biến mất. Đây không phải là hạ thấp. Lò vi sóng chỉ là làm nóng các phân tử nước, nhưng nó đã thay đổi nhà bếp.
Bước Tiếp Theo
LLM sẽ trở thành một thứ giống như JPEG: ở khắp mọi nơi, không ai thảo luận, nhưng không thể thiếu.
Trước đó, những người thông minh sẽ chọn nhà cung cấp rẻ nhất trong cuộc chiến giá cả. Bởi vì khi công nghệ trở thành hàng hóa, điều duy nhất quan trọng là chi phí.





