LLM ಮುಂದಿನ JPEG
ನಾನು ಒಂದು ಕಥೆ ಹೇಳುತ್ತೇನೆ.
1990 ರ ದಶಕದಲ್ಲಿ, ನೀವು ಬೇರೆಯವರಿಗೆ ಫೋಟೋ ಕಳುಹಿಸಲು ಬಯಸಿದರೆ, ನೀವು ಬಹಳಷ್ಟು ವಿಷಯಗಳನ್ನು ಪರಿಗಣಿಸಬೇಕಾಗಿತ್ತು: ಫೈಲ್ ಫಾರ್ಮ್ಯಾಟ್, ಕಂಪ್ರೆಷನ್ ಅಲ್ಗಾರಿದಮ್, ಬಣ್ಣದ ಆಳ. ಪ್ರತಿಯೊಂದು ಸಾಫ್ಟ್ವೇರ್ಗೂ ತನ್ನದೇ ಆದ ಫಾರ್ಮ್ಯಾಟ್ ಇತ್ತು. ನಂತರ JPEG ಬಂತು.
פתאום, אף אחד לא דאג יותר לגבי פורמטי תמונות. JPEG ಮೂಲಸೌಕರ್ಯವಾಯಿತು. ನೀವು "ನಾನು JPEG ಬಳಸಿ ಚಿತ್ರವನ್ನು ಮಾಡಿದ್ದೇನೆ" ಎಂದು ಹೇಳುವುದಿಲ್ಲ, ನೀವು "ನಾನು ಚಿತ್ರವನ್ನು ಕಳುಹಿಸಿದ್ದೇನೆ" ಎಂದು ಮಾತ್ರ ಹೇಳುತ್ತೀರಿ.
LLM ಅದೇ ಹಾದಿಯಲ್ಲಿ ಸಾಗುತ್ತಿದೆ.
ತಂತ್ರಜ್ಞಾನವು ಗಾಳಿಯಾದಾಗ
"LLM ಒಂದು ಸರಕು. Apple LLM ಕಂಪನಿಗಳಿಂದ ಟೋಕನ್ಗಳನ್ನು ಖರೀದಿಸಲು ಸಂತೋಷಪಡುತ್ತದೆ, ಆದರೆ Apple ವಿಭಿನ್ನ ಉತ್ಪನ್ನಗಳನ್ನು ಮಾರಾಟ ಮಾಡುವ ಕಂಪನಿಯಾಗಿದೆ." — @deuteronormative
ಈ ಹೇಳಿಕೆ ನೇರವಾಗಿದೆ. ನೀವು Apple ಆಗಿದ್ದರೆ, ನೀವು ವಿದ್ಯುತ್ ಉತ್ಪಾದಿಸುವುದಿಲ್ಲ, ನೀವು ಗ್ರಿಡ್ನಿಂದ ವಿದ್ಯುತ್ ಖರೀದಿಸುತ್ತೀರಿ. ನೀವು ಟೈರ್ಗಳನ್ನು ತಯಾರಿಸುವುದಿಲ್ಲ, ನೀವು Michelin ನಿಂದ ಟೈರ್ಗಳನ್ನು ಖರೀದಿಸುತ್ತೀರಿ. ಈಗ, ನೀವು LLM ಅನ್ನು ತರಬೇತಿಗೊಳಿಸುವುದಿಲ್ಲ, ನೀವು ಕ್ಲೌಡ್ನಿಂದ ಟೋಕನ್ಗಳನ್ನು ಖರೀದಿಸುತ್ತೀರಿ.
LLM ಮುಖ್ಯವಲ್ಲ ಎಂದು ಇದರ ಅರ್ಥವಲ್ಲ. ವಿದ್ಯುತ್ ಮುಖ್ಯ. ಟೈರ್ಗಳು ಮುಖ್ಯ. ಆದರೆ ಅವು ಮೂಲಸೌಕರ್ಯ, ವ್ಯತ್ಯಾಸದ ಅಂಶವಲ್ಲ.
ವೆಚ್ಚದ ಯುದ್ಧದ ವಿಜೇತರು
Alibaba ಇತ್ತೀಚೆಗೆ ಬಿಡುಗಡೆ ಮಾಡಿದ Qwen 3.5:
- 397 ಶತಕೋಟಿ ನಿಯತಾಂಕಗಳು, 17 ಶತಕೋಟಿ ಸಕ್ರಿಯಗೊಳಿಸುವಿಕೆಗಳು
- Qwen 3 ಗಿಂತ 60% ಅಗ್ಗ
- 8 ಪಟ್ಟು ವೇಗ
- ಟೋಕನ್ ಬೆಲೆ Gemini 3 Pro ನ 1/18
ಇದು ತಾಂತ್ರಿಕ ಪ್ರಗತಿಯಲ್ಲ, ಇದು ಬೆಲೆ ಯುದ್ಧ. LCD ಟಿವಿಗಳು ಸಹ ಅದೇ ರೀತಿ ಬೆಲೆ ಇಳಿದವು. 1000 ಡಾಲರ್ಗಿಂತ ಕಡಿಮೆ ಬೆಲೆಗೆ ಇಳಿದ ಮೊದಲ ಕಂಪನಿ ತಂತ್ರಜ್ಞಾನದಲ್ಲಿ ಉತ್ತಮವಾಗಿರಲಿಲ್ಲ, ಆದರೆ ಅದು ವಿಜೇತ.
ಪ್ರಾಯೋಗಿಕ ಸಲಹೆ
ನೀವು ಡೆವಲಪರ್ ಆಗಿದ್ದರೆ, ಇದರ ಅರ್ಥವೇನು?
-
ನೀವೇ ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೊಳಿಸಬೇಡಿ. ನೀವು OpenAI, Anthropic ಅಥವಾ Alibaba ಆಗದ ಹೊರತು, ಮಾದರಿಯನ್ನು ತರಬೇತಿಗೊಳಿಸುವುದು ಹಣವನ್ನು ಸುಡುವುದು. API ಬಳಸಿ.
-
ನಿಯತಾಂಕಗಳಿಗಿಂತ ಬೆಲೆಯ ಮೇಲೆ ಗಮನಹರಿಸಿ. 397 ಶತಕೋಟಿ ನಿಯತಾಂಕಗಳು ತಂಪಾಗಿ ಕಾಣಿಸಬಹುದು, ಆದರೆ ನಿಮ್ಮ ಬಳಕೆದಾರರು ತಲೆಕೆಡಿಸಿಕೊಳ್ಳುವುದಿಲ್ಲ. ಅವರು ಪ್ರತಿಕ್ರಿಯೆ ವೇಗ ಮತ್ತು ವೆಚ್ಚದ ಬಗ್ಗೆ ಕಾಳಜಿ ವಹಿಸುತ್ತಾರೆ.
-
ಸ್ಥಳಾಂತರಕ್ಕೆ ಸಿದ್ಧರಾಗಿರಿ. LLM ಒಂದು ಸರಕು, ಅಂದರೆ ಬದಲಾಯಿಸಬಹುದಾದದ್ದು. ಇಂದು GPT ಬಳಸಿ, ನಾಳೆ Claude ಬಳಸಿ, ನಾಡಿದ್ದು Qwen ಬಳಸಿ. ನಿಮ್ಮ ಆರ್ಕಿಟೆಕ್ಚರ್ ಈ ಬದಲಾವಣೆಯನ್ನು ಬೆಂಬಲಿಸಬೇಕು.
ಕುತೂಹಲಕಾರಿ ವಿರೋಧಾಭಾಸ
LLM ಬಗ್ಗೆ ಹೆಚ್ಚು ತಿಳಿದಿರುವ ಜನರು LLM ಬಗ್ಗೆ ಹೆಚ್ಚು ಮಾತನಾಡುವುದಿಲ್ಲ.
"Andrej Karpathy 240 ಸಾಲುಗಳ ಶುದ್ಧ Python ನಲ್ಲಿ ಮಿನಿ GPT ಅನ್ನು ಬರೆದಿದ್ದಾರೆ. TensorFlow ಇಲ್ಲ. PyTorch ಇಲ್ಲ. ಗಣಿತ ಮಾತ್ರ. LLM ಮ್ಯಾಜಿಕ್ ಅಲ್ಲ ಎಂದು ಅದು ತೋರಿಸುತ್ತದೆ - ಅವು ಕೇವಲ ಮುಂದಿನ ಟೋಕನ್ ಭವಿಷ್ಯ." (Andrej Karpathy wrote a mini GPT in 240 lines of pure Python. No TensorFlow. No PyTorch. Just math. It shows that LLMs are not magic - they are just next token prediction.)
"ಮುಂದಿನ ಟೋಕನ್ ಭವಿಷ್ಯ" ಎನ್ನುವುದು ಈ ತಂತ್ರಜ್ಞಾನದ ಸಾರಾಂಶ ಎಂದು ನೀವು ಅರ್ಥಮಾಡಿಕೊಂಡಾಗ, ಬಹಳಷ್ಟು ಪ್ರಚಾರವು ಮಾಯವಾಗುತ್ತದೆ. ಇದು ಕಡೆಗಣಿಸುವ ಹೇಳಿಕೆಯಲ್ಲ. ಮೈಕ್ರೋವೇವ್ ಓವನ್ ನೀರಿನ ಅಣುಗಳನ್ನು ಬಿಸಿ ಮಾಡುತ್ತದೆ, ಆದರೆ ಅದು ಅಡುಗೆಮನೆಯನ್ನು ಬದಲಾಯಿಸುತ್ತದೆ.
ಮುಂದೇನು
LLM JPEG ನಂತೆ ಆಗುತ್ತದೆ: ಎಲ್ಲೆಡೆ ಇರುತ್ತದೆ, ಯಾರೂ ಚರ್ಚಿಸುವುದಿಲ್ಲ, ಆದರೆ ಅತ್ಯಗತ್ಯವಾಗಿರುತ್ತದೆ.
ಅಲ್ಲಿಯವರೆಗೆ, ಬುದ್ಧಿವಂತ ಜನರು ಬೆಲೆ ಯುದ್ಧದಲ್ಲಿ ಅಗ್ಗದ ಪೂರೈಕೆದಾರರನ್ನು ಆಯ್ಕೆ ಮಾಡುತ್ತಾರೆ. ಏಕೆಂದರೆ ತಂತ್ರಜ್ಞಾನವು ಸರಕು ಆದಾಗ, ವೆಚ್ಚ ಮಾತ್ರ ಮುಖ್ಯವಾಗುತ್ತದೆ.





