LLM არის შემდეგი JPEG
ნება მომეცით მოგიყვეთ ამბავი.
1990-იან წლებში, თუ გსურდათ ფოტოს გაგზავნა ვინმესთვის, ბევრი რამ უნდა გაითვალისწინოთ: ფაილის ფორმატი, შეკუმშვის ალგორითმი, ფერის სიღრმე. თითოეულ პროგრამას ჰქონდა საკუთარი ფორმატი. შემდეგ გამოჩნდა JPEG.
უცებ, აღარავის აინტერესებდა სურათის ფორმატი. JPEG გახდა ინფრასტრუქტურა. თქვენ არ იტყვით "მე გავაკეთე სურათი JPEG-ით", თქვენ უბრალოდ იტყვით "მე გამოვაგზავნე სურათი".
LLM იგივე გზას გადის.
როდესაც ტექნოლოგია ჰაერად იქცევა
"LLM არის საქონელი. Apple სიამოვნებით იყიდის ტოკენებს LLM კომპანიებისგან, მაგრამ Apple არის კომპანია, რომელიც ყიდის დიფერენცირებულ პროდუქტებს." — @deuteronormative
ეს პირდაპირ ნათქვამია. თუ თქვენ ხართ Apple, თქვენ არ გამოიმუშავებთ ელექტროენერგიას თავად, თქვენ ყიდულობთ ელექტროენერგიას ქსელიდან. თქვენ არ აწარმოებთ საბურავებს თავად, თქვენ ყიდულობთ საბურავებს Michelin-ისგან. ახლა, თქვენ ასევე არ გაწვრთნით LLM-ს თავად, თქვენ ყიდულობთ ტოკენებს ღრუბლიდან.
ეს არ ნიშნავს, რომ LLM არ არის მნიშვნელოვანი. ელექტროენერგია მნიშვნელოვანია. საბურავები მნიშვნელოვანია. მაგრამ ისინი ინფრასტრუქტურაა და არა დიფერენციაციის ფაქტორი.
ხარჯების ომის გამარჯვებული
Alibaba-ს მიერ ახლახან გამოშვებული Qwen 3.5:
- 397 მილიარდი პარამეტრი, 17 მილიარდი გააქტიურებული
- 60%-ით იაფია ვიდრე Qwen 3
- 8-ჯერ უფრო სწრაფი
- ტოკენის ფასი არის Gemini 3 Pro-ს 1/18
ეს არ არის ტექნოლოგიური გარღვევა, ეს არის ფასების ომი. LCD ტელევიზორებიც ასე გაიაფდა. პირველი კომპანია, რომელმაც ფასი 1000 დოლარზე დაბლა ჩამოიყვანა, არ იყო ტექნოლოგიურად საუკეთესო, მაგრამ ის იყო გამარჯვებული.
პრაგმატული რჩევა
რას ნიშნავს ეს თქვენთვის, როგორც დეველოპერისთვის?
-
ნუ გაწვრთნით მოდელს თავად. თუ თქვენ არ ხართ OpenAI, Anthropic ან Alibaba, მოდელის გაწვრთნა ფულის ფლანგვაა. გამოიყენეთ API.
-
ფოკუსირდით ფასზე და არა პარამეტრებზე. 397 მილიარდი პარამეტრი მაგარია, მაგრამ თქვენს მომხმარებლებს არ აინტერესებთ. მათ აინტერესებთ რეაგირების სიჩქარე და ღირებულება.
-
მოემზადეთ მიგრაციისთვის. LLM არის საქონელი, რაც იმას ნიშნავს, რომ ის ჩანაცვლებადია. დღეს გამოიყენეთ GPT, ხვალ გამოიყენეთ Claude, ზეგ გამოიყენეთ Qwen. თქვენმა არქიტექტურამ უნდა დაუჭიროს მხარი ამგვარ გადართვას.
საინტერესო პარადოქსი
LLM-ის ყველაზე მცოდნე ადამიანები ყველაზე ნაკლებად საუბრობენ LLM-ზე.
"Andrej Karpathy-მ დაწერა მინი GPT 240 ხაზ კოდში, სუფთა Python-ზე. არ არის TensorFlow. არ არის PyTorch. მხოლოდ მათემატიკა. ეს აჩვენებს, რომ LLM არ არის მაგია - ისინი უბრალოდ შემდეგი ტოკენის პროგნოზირებაა."
როდესაც გესმით, რომ "შემდეგი ტოკენის პროგნოზირება" არის ამ ტექნოლოგიის არსი, ბევრი აჟიოტაჟი ქრება. ეს არ არის დაკნინება. მიკროტალღური ღუმელი უბრალოდ ათბობს წყლის მოლეკულებს, მაგრამ მან შეცვალა სამზარეულო.
შემდეგი ნაბიჯი
LLM გახდება ისეთი რამ, როგორიცაა JPEG: ყველგან გავრცელებული, არავინ განიხილავს, მაგრამ აუცილებელია.
მანამდე, ჭკვიანი ადამიანები ფასების ომში აირჩევენ ყველაზე იაფ მომწოდებელს. რადგან როდესაც ტექნოლოგია საქონლად იქცევა, ერთადერთი მნიშვნელოვანი ღირებულებაა.





