LLM është JPEG-i i ardhshëm

2/17/2026
3 min read

Më lejoni t'ju tregoj një histori.

Në vitet 1990, nëse dëshiroje t'i dërgoje një foto dikujt, duhej të merrje parasysh shumë gjëra: formatin e skedarit, algoritmin e kompresimit, thellësinë e ngjyrave. Çdo softuer kishte formatin e vet. Pastaj u shfaq JPEG.

Papritmas, askujt nuk i interesohej më formati i imazhit. JPEG u bë infrastrukturë. Nuk do të thoshit "Bëra një imazh me JPEG", thjesht do të thoshit "Dërgova një imazh".

LLM po ndjek të njëjtën rrugë.

Kur teknologjia bëhet ajër

"LLM është një mall. Apple është i lumtur të blejë tokens nga kompanitë LLM, por Apple është një kompani që shet produkte të diferencuara." — @deuteronormative

Kjo fjali e thotë troç. Nëse jeni Apple, nuk do të gjeneroni energji elektrike vetë, por do ta blini nga rrjeti elektrik. Nuk do të prodhoni goma vetë, por do t'i blini nga Michelin. Tani, nuk do të trajnoni LLM vetë, por do të blini tokens nga cloud-i.

Kjo nuk do të thotë se LLM nuk është i rëndësishëm. Elektriciteti është i rëndësishëm. Gomat janë të rëndësishme. Por ato janë infrastrukturë, jo faktorë diferencues.

Fituesi i luftës së kostos

Qwen 3.5 i sapo-lëshuar nga Alibaba:

  • 397 miliardë parametra, 17 miliardë aktivizime
  • 60% më i lirë se Qwen 3
  • 8 herë më i shpejtë
  • Çmimi i token-it është 1/18 e Gemini 3 Pro

Ky nuk është një përparim teknologjik, kjo është një luftë çmimesh. Kështu ranë çmimet e televizorëve LCD në atë kohë. Kompania e parë që ra nën 1000 dollarë nuk ishte ajo me teknologjinë më të mirë, por ishte fituesi.

Këshilla pragmatike

Çfarë do të thotë kjo nëse jeni zhvillues?

  1. Mos trajnoni modele vetë. Përveç nëse jeni OpenAI, Anthropic ose Alibaba, trajnimi i modeleve është humbje parash. Përdorni API.

  2. Përqendrohuni te çmimi dhe jo te parametrat. 397 miliardë parametra tingëllojnë bukur, por përdoruesve tuaj nuk u interesohet. Atyre u intereson shpejtësia e përgjigjes dhe kostoja.

  3. Bëhuni gati për migrim. LLM është një mall, që do të thotë se mund të zëvendësohet. Sot përdorni GPT, nesër Claude, pasnesër Qwen. Arkitektura juaj duhet të mbështesë këtë kalim.

Paradoks interesant

Njerëzit që e kuptojnë më së miri LLM nuk flasin shumë për LLM.

"Andrej Karpathy shkroi një mini GPT me 240 rreshta Python të pastër. Pa TensorFlow. Pa PyTorch. Vetëm matematikë. Kjo tregon se LLM nuk është magji - ato janë thjesht parashikimi i token-it të ardhshëm."

Kur e kuptoni se "parashikimi i token-it të ardhshëm" është e gjitha ajo që është kjo teknologji, shumë hype zhduket. Kjo nuk është nënçmim. Mikrovala thjesht ngroh molekulat e ujit, por ajo e ndryshoi kuzhinën.

Hapi tjetër

LLM do të bëhet diçka si JPEG: kudo, askush nuk e diskuton, por i domosdoshëm.

Para kësaj, njerëzit e zgjuar do të zgjedhin furnizuesin më të lirë në luftën e çmimeve. Sepse kur teknologjia bëhet mall, e vetmja gjë e rëndësishme është kostoja.

Published in Technology

You Might Also Like