Το LLM είναι το επόμενο JPEG
Ας σας πω μια ιστορία.
Στη δεκαετία του 1990, αν θέλατε να στείλετε μια φωτογραφία σε κάποιον, έπρεπε να σκεφτείτε πολλά: μορφή αρχείου, αλγόριθμο συμπίεσης, βάθος χρώματος. Κάθε λογισμικό είχε τη δική του μορφή. Μετά εμφανίστηκε το JPEG.
Ξαφνικά, κανείς δεν νοιαζόταν πλέον για τη μορφή εικόνας. Το JPEG έγινε υποδομή. Δεν θα λέγατε «Έκανα μια εικόνα με JPEG», απλά λέτε «Έστειλα μια εικόνα».
Το LLM ακολουθεί την ίδια πορεία.
Όταν η τεχνολογία γίνεται αέρας
"Το LLM είναι ένα εμπόρευμα. Η Apple είναι χαρούμενη να αγοράζει tokens από εταιρείες LLM, αλλά η Apple είναι μια εταιρεία που πουλά διαφοροποιημένα προϊόντα." — @deuteronormative
Αυτή η δήλωση είναι ξεκάθαρη. Αν είστε η Apple, δεν παράγετε δική σας ηλεκτρική ενέργεια, αγοράζετε ηλεκτρική ενέργεια από το δίκτυο. Δεν φτιάχνετε τα δικά σας ελαστικά, αγοράζετε ελαστικά από τη Michelin. Τώρα, δεν θα εκπαιδεύσετε το δικό σας LLM, αγοράζετε tokens από το cloud.
Αυτό δεν σημαίνει ότι το LLM δεν είναι σημαντικό. Η ηλεκτρική ενέργεια είναι σημαντική. Τα ελαστικά είναι σημαντικά. Αλλά είναι υποδομή, όχι διαφοροποιητικός παράγοντας.
Ο νικητής του πολέμου κόστους
Το Qwen 3.5 που μόλις κυκλοφόρησε η Alibaba:
- 397 δισεκατομμύρια παράμετροι, 17 δισεκατομμύρια ενεργοποιήσεις
- 60% φθηνότερο από το Qwen 3
- 8 φορές πιο γρήγορο
- Η τιμή του Token είναι το 1/18 του Gemini 3 Pro
Δεν πρόκειται για τεχνολογική ανακάλυψη, αλλά για πόλεμο τιμών. Οι τηλεοράσεις LCD μείωσαν επίσης τις τιμές τους με αυτόν τον τρόπο. Η πρώτη εταιρεία που έπεσε κάτω από τα 1000 δολάρια δεν ήταν η καλύτερη τεχνολογικά, αλλά ήταν ο νικητής.
Πρακτικές συμβουλές
Τι σημαίνει αυτό αν είστε προγραμματιστής;
-
Μην εκπαιδεύετε μόνοι σας μοντέλα. Εκτός αν είστε OpenAI, Anthropic ή Alibaba, η εκπαίδευση μοντέλων είναι σπατάλη χρημάτων. Χρησιμοποιήστε API.
-
Εστιάστε στην τιμή και όχι στις παραμέτρους. Οι 397 δισεκατομμύρια παράμετροι ακούγονται ωραία, αλλά οι χρήστες σας δεν νοιάζονται. Αυτό που τους ενδιαφέρει είναι η ταχύτητα απόκρισης και το κόστος.
-
Ετοιμαστείτε για μετεγκατάσταση. Το LLM είναι ένα εμπόρευμα, που σημαίνει ότι είναι αντικαταστάσιμο. Σήμερα χρησιμοποιείτε GPT, αύριο Claude και μεθαύριο Qwen. Η αρχιτεκτονική σας θα πρέπει να υποστηρίζει αυτήν την αλλαγή.
Ένα ενδιαφέρον παράδοξο
Οι άνθρωποι που γνωρίζουν περισσότερα για το LLM δεν μιλούν πολύ για αυτό.
"Ο Andrej Karpathy έγραψε ένα μίνι GPT με 240 γραμμές καθαρού Python. Χωρίς TensorFlow. Χωρίς PyTorch. Μόνο μαθηματικά. Δείχνει ότι το LLM δεν είναι μαγικό - είναι απλώς η πρόβλεψη του επόμενου token."
Όταν καταλάβετε ότι η «πρόβλεψη του επόμενου token» είναι το παν για αυτήν την τεχνολογία, πολλή διαφημιστική εκστρατεία εξαφανίζεται. Αυτό δεν είναι υποτίμηση. Ο φούρνος μικροκυμάτων θερμαίνει απλώς μόρια νερού, αλλά αλλάζει την κουζίνα.
Επόμενο βήμα
Το LLM θα γίνει κάτι σαν το JPEG: πανταχού παρόν, κανείς δεν το συζητά, αλλά απαραίτητο.
Μέχρι τότε, οι έξυπνοι άνθρωποι θα επιλέξουν τον φθηνότερο προμηθευτή στον πόλεμο τιμών. Επειδή όταν η τεχνολογία γίνεται εμπόρευμα, το μόνο που έχει σημασία είναι το κόστος.





