GPT ಯ ವೆಚ್ಚದ ಗೋಡೆ
ಕಳೆದ ವಾರ, GPT ಕುರಿತ ಚರ್ಚೆಗಳು X ನಲ್ಲಿ ಒಂದು ಹೊಸ ಕೇಂದ್ರಬಿಂದುವನ್ನು ಹೊಂದಿವೆ: ಸಾಮರ್ಥ್ಯವಲ್ಲ, ಆದರೆ ವೆಚ್ಚ.
ARC-AGI: ಬುದ್ಧಿವಂತಿಕೆಯ ಗಡಿ
ಪ್ರಸ್ತುತ ಅತ್ಯಾಧುನಿಕ ಮಾದರಿಗಳು ARC-AGI-2 ನಲ್ಲಿ ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ:
| ಮಾದರಿ | ARC-AGI-2 ಸ್ಕೋರ್ |
|---|---|
| GPT-5.2 Pro | ~54% |
| GPT-5.2 Refine | ~73% |
| ಮಾನವ | 100% |
54% ರಿಂದ 73% ರವರೆಗಿನ ವ್ಯತ್ಯಾಸವು ಬುದ್ಧಿವಂತಿಕೆಯ ಸಮಸ್ಯೆಯಲ್ಲ, ಅದು "ಪರಿಷ್ಕರಣೆ" - ಮಾದರಿಯು ತನ್ನದೇ ಆದ ಉತ್ತರಗಳನ್ನು ಪದೇ ಪದೇ ಪರಿಶೀಲಿಸುವಂತೆ ಮಾಡುವುದು. ಇದಕ್ಕೆ ಹೆಚ್ಚಿನ ಲೆಕ್ಕಾಚಾರದ ಅಗತ್ಯವಿದೆ, ಅಂದರೆ ಹೆಚ್ಚಿನ ವೆಚ್ಚ.
ಏಜೆಂಟ್ನ ನಿಜವಾದ ವೆಚ್ಚ
24/7 ಉದ್ಯಮ-ದರ್ಜೆಯ ಏಜೆಂಟ್ನ ವಾರ್ಷಿಕ ವೆಚ್ಚ (ಪ್ರತಿ ದಿನ 20 ಮಿಲಿಯನ್ ಇನ್ಪುಟ್ + 20 ಮಿಲಿಯನ್ ಔಟ್ಪುಟ್ ಟೋಕನ್ಗಳು):
| ಮಾದರಿ | ವಾರ್ಷಿಕ ವೆಚ್ಚ |
|---|---|
| Palmyra X5 | ~$48K |
| GPT-5.2 Standard | ~$57K |
| Gemini 2.5 Pro | ~$82K |
| Claude Sonnet 4.5 | ~$131K |
| Claude Opus 4.6 | ~$219K |
| GPT-5.2 Pro | ~$690K |
GPT-5.2 Pro, GPT-5.2 Standard ಗಿಂತ 12 ಪಟ್ಟು ಹೆಚ್ಚು ದುಬಾರಿಯಾಗಿದೆ. ಇದು ಬೆಲೆ ನಿಗದಿ ಮಾಡುವ ಸಮಸ್ಯೆಯಲ್ಲ, ಇದು ವೆಚ್ಚದ ರಚನೆಯ ಸಮಸ್ಯೆ.
"ನೀವು 100 AI ಏಜೆಂಟ್ಗಳನ್ನು ನಿಯೋಜಿಸುವ ಮೊದಲು, ಲೆಕ್ಕಾಚಾರವನ್ನು ಮಾಡಿ." — @waseem_s
ಹೊಸ ಟ್ಯೂರಿಂಗ್ ಪರೀಕ್ಷೆ
ಒಂದು ಸರಳ ಪ್ರಶ್ನೆಯು ಹೊಸ ಬುದ್ಧಿವಂತಿಕೆಯ ಪರೀಕ್ಷೆಯಾಗುತ್ತಿದೆ:
"ನನ್ನ ಮನೆಯಿಂದ ಕಾರ್ ವಾಶ್ ಅಂಗಡಿ 40 ಮೀಟರ್ ದೂರದಲ್ಲಿದೆ. ನಾನು ಕಾರ್ ವಾಶ್ ಮಾಡಲು ಹೋಗಲು ನಡೆದುಕೊಂಡು ಹೋಗಬೇಕೋ ಅಥವಾ ಕಾರಿನಲ್ಲಿ ಹೋಗಬೇಕೋ?"
ಉತ್ತೀರ್ಣರಾದ ಮಾದರಿಗಳು: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro ವಿಫಲವಾದ ಮಾದರಿಗಳು: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5
ಈ ಪರೀಕ್ಷೆಯು ಏಕೆ ಅರ್ಥಪೂರ್ಣವಾಗಿದೆ? ಏಕೆಂದರೆ ಇದು "ಸಾಮಾನ್ಯ ಜ್ಞಾನದ ತಾರ್ಕಿಕತೆ"ಯನ್ನು ಪರೀಕ್ಷಿಸುತ್ತದೆ, "ಜ್ಞಾನದ ಮರುಪಡೆಯುವಿಕೆ"ಯನ್ನಲ್ಲ. 40 ಮೀಟರ್ ಎಂದರೆ ನಡೆಯುವ ದೂರ. ಕಾರು ಕೊಳೆಯಾಗಿದ್ದರೆ ತೊಳೆಯಬೇಕು. ಆದರೆ ನೀವು ಕೊಳಕು ಕಾರನ್ನು 40 ಮೀಟರ್ ದೂರಕ್ಕೆ ತೊಳೆಯಲು ಓಡಿಸುವುದಿಲ್ಲ - ನಿಮಗೆ ಸಾಮಾನ್ಯ ಜ್ಞಾನವಿಲ್ಲದಿದ್ದರೆ ಮಾತ್ರ.
ಇತಿಹಾಸವು ಪುನರಾವರ್ತನೆಯಾಗುವುದಿಲ್ಲ, ಆದರೆ ಪ್ರಾಸಬದ್ಧವಾಗಿರುತ್ತದೆ
"ತಜ್ಞ ವ್ಯವಸ್ಥೆಗಳು 1970 ರ ದಶಕದಲ್ಲಿ ಜನಿಸಿದವು, 1980 ರ ದಶಕದಲ್ಲಿ ಅಭಿವೃದ್ಧಿ ಹೊಂದಿದವು ಮತ್ತು AI ನ ಭವಿಷ್ಯವೆಂದು ವ್ಯಾಪಕವಾಗಿ ಪರಿಗಣಿಸಲ್ಪಟ್ಟವು." — @ChombaBupe
GPT ಮಾದರಿಗಳು 2018 ರಲ್ಲಿ ಜನಿಸಿದವು, 2020 ರ ದಶಕದಲ್ಲಿ ಅಭಿವೃದ್ಧಿ ಹೊಂದಿದವು ಮತ್ತು AI ನ ಭವಿಷ್ಯವೆಂದು ವ್ಯಾಪಕವಾಗಿ ಪರಿಗಣಿಸಲ್ಪಟ್ಟವು.
ತಜ್ಞ ವ್ಯವಸ್ಥೆಗಳ ವೈಫಲ್ಯಕ್ಕೆ ಅವು ಸಾಕಷ್ಟು ಬುದ್ಧಿವಂತವಾಗಿಲ್ಲ ಎಂಬುದು ಕಾರಣವಲ್ಲ, ಆದರೆ ನಿರ್ವಹಣಾ ವೆಚ್ಚವು ತುಂಬಾ ಹೆಚ್ಚಾಗಿತ್ತು ಮತ್ತು ವಿಸ್ತರಣೆಯು ತುಂಬಾ ಕಳಪೆಯಾಗಿತ್ತು. ಜ್ಞಾನದ ಆಧಾರವನ್ನು ಕೈಯಿಂದ ನಿರ್ವಹಿಸಬೇಕಾದಾಗ, ಗಾತ್ರವೇ ಶತ್ರು.
GPT ಒಂದು ಕನ್ನಡಿಯ ಸಮಸ್ಯೆಯನ್ನು ಎದುರಿಸುತ್ತಿದೆ: ಮಾದರಿಯು ಬುದ್ಧಿವಂತವಾಗಿದೆ, ಆದರೆ ತಾರ್ಕಿಕ ವೆಚ್ಚವು ತುಂಬಾ ಹೆಚ್ಚಾಗಿದೆ. ಪ್ರತಿ ವಿನಂತಿಗೆ ಹೆಚ್ಚಿನ ಲೆಕ್ಕಾಚಾರದ ಅಗತ್ಯವಿದ್ದಾಗ, ಗಾತ್ರವು ಸಹ ಶತ್ರುವಾಗುತ್ತದೆ.
ಮುಂದೇನು
ಈ ವಾರ ಹಲವಾರು ಹೊಸ ಮಾದರಿಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ನಿರೀಕ್ಷೆಯಿದೆ: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.
ಸ್ಪರ್ಧೆಯು "ಯಾರು ಹೆಚ್ಚು ಬುದ್ಧಿವಂತರು" ಎಂಬುದರಿಂದ "ಯಾರು ಅಗ್ಗದವರು" ಎಂಬುದಕ್ಕೆ ಬದಲಾಗುತ್ತಿದೆ. ಇದು ಬಳಕೆದಾರರಿಗೆ ಒಳ್ಳೆಯ ಸುದ್ದಿ. OpenAI ಗೆ? ಖಚಿತವಾಗಿ ಹೇಳಲಾಗುವುದಿಲ್ಲ.





