LLM бол дараагийн JPEG
Надаар нэг түүх яриулаач.
1990-ээд онд хэрэв та хэн нэгэнд зураг илгээхийг хүсвэл олон зүйлийг бодох хэрэгтэй болдог байсан: файлын формат, шахалтын алгоритм, өнгөний гүн. Програм хангамж бүр өөрийн гэсэн форматтай байсан. Дараа нь JPEG гарч ирсэн.
Гэнэт хэн ч зургийн форматыг тоодоггүй болсон. JPEG нь дэд бүтэц болсон. Та "Би JPEG ашиглан зураг хийсэн" гэж хэлэхгүй, харин "Би зураг илгээсэн" гэж хэлнэ.
LLM яг ижил замаар явж байна.
Технологи агаар мэт болох үед
"LLM бол бараа. Apple LLM компаниудаас tokens худалдаж авахад баяртай байх болно, гэхдээ Apple бол ялгаатай бүтээгдэхүүн борлуулдаг компани юм." — @deuteronormative
Энэ үг шулуухан хэлсэн байна. Хэрэв та Apple бол та өөрөө цахилгаан үйлдвэрлэхгүй, цахилгааны сүлжээнээс цахилгаан худалдаж авна. Та өөрөө дугуй хийхгүй, Michelin-ээс дугуй худалдаж авна. Одоо та өөрөө LLM сургахгүй, үүлэн технологиос tokens худалдаж авна.
Энэ нь LLM чухал биш гэсэн үг биш. Цахилгаан чухал. Дугуй чухал. Гэхдээ эдгээр нь дэд бүтэц болохоос ялгаатай хүчин зүйл биш юм.
Зардлын дайны ялагч
Alibaba-аас дөнгөж сая гаргасан Qwen 3.5:
- 397 тэрбум параметр, 17 тэрбум идэвхтэй
- Qwen 3-аас 60%-иар хямд
- 8 дахин хурдан
- Token-ийн үнэ Gemini 3 Pro-ийн 1/18
Энэ бол технологийн дэвшил биш, харин үнийн дайн юм. Тухайн үед шингэн болор телевизор ч бас ийм аргаар үнэ буурсан. 1000 доллараас доош үнэтэй болсон анхны компани нь хамгийн сайн технологитой компани биш байсан ч ялагч болсон.
Прагматик зөвлөмж
Хэрэв та хөгжүүлэгч бол энэ нь юу гэсэн үг вэ?
-
Өөрөө загвар сургах хэрэггүй. Хэрэв та OpenAI, Anthropic эсвэл Alibaba биш бол загвар сургах нь мөнгө үрэх явдал юм. API ашигла.
-
Параметрээс илүү үнэнд анхаарлаа хандуул. 397 тэрбум параметр нь гайхалтай сонсогдож байгаа ч таны хэрэглэгчид үүнд санаа зовохгүй. Тэд хариу өгөх хурд болон зардлыг л тооно.
-
Шилжихэд бэлэн бай. LLM бол бараа гэдэг нь орлуулах боломжтой гэсэн үг. Өнөөдөр GPT ашиглаж, маргааш Claude ашиглаж, нөгөөдөр нь Qwen ашигла. Таны архитектур ийм шилжилтийг дэмжих ёстой.
Сонирхолтой зөрчил
LLM-ийг хамгийн сайн мэддэг хүмүүс LLM-ийн талаар бараг ярьдаггүй.
"Andrej Karpathy 240 мөр цэвэр Python ашиглан мини GPT бичсэн. TensorFlow байхгүй. PyTorch байхгүй. Зөвхөн математик. Энэ нь LLM бол ид шид биш, харин дараагийн token-ийн таамаглал гэдгийг харуулж байна."
Та "дараагийн token-ийн таамаглал" гэдэг нь энэ технологийн бүх зүйл гэдгийг ойлгоход олон шуугиан арилдаг. Энэ нь дорд үзсэн хэрэг биш. Бичил долгионы зуух нь усны молекулыг халаадаг ч гал тогооны өрөөг өөрчилдөг.
Дараагийн алхам
LLM нь JPEG шиг зүйл болно: хаа сайгүй байдаг, хэн ч ярьдаггүй, гэхдээ зайлшгүй шаардлагатай.
Тэр болтол ухаантай хүмүүс үнийн дайнаас хамгийн хямд нийлүүлэгчийг сонгох болно. Учир нь технологи бараа болоход цорын ганц чухал зүйл бол зардал юм.





