GPT ಯ ವೆಚ್ಚದ ಗೋಡೆ

ಕಳೆದ ವಾರ, GPT ಕುರಿತ ಚರ್ಚೆಗಳು X ನಲ್ಲಿ ಒಂದು ಹೊಸ ಕೇಂದ್ರಬಿಂದುವನ್ನು ಹೊಂದಿವೆ: ಸಾಮರ್ಥ್ಯವಲ್ಲ, ಆದರೆ ವೆಚ್ಚ.

ARC-AGI: ಬುದ್ಧಿವಂತಿಕೆಯ ಗಡಿ

ಪ್ರಸ್ತುತ ಅತ್ಯಾಧುನಿಕ ಮಾದರಿಗಳು ARC-AGI-2 ನಲ್ಲಿ ಹೇಗೆ ಕಾರ್ಯನಿರ್ವಹಿಸುತ್ತವೆ:

ಮಾದರಿ	ARC-AGI-2 ಸ್ಕೋರ್
GPT-5.2 Pro	~54%
GPT-5.2 Refine	~73%
ಮಾನವ	100%

54% ರಿಂದ 73% ರವರೆಗಿನ ವ್ಯತ್ಯಾಸವು ಬುದ್ಧಿವಂತಿಕೆಯ ಸಮಸ್ಯೆಯಲ್ಲ, ಅದು "ಪರಿಷ್ಕರಣೆ" - ಮಾದರಿಯು ತನ್ನದೇ ಆದ ಉತ್ತರಗಳನ್ನು ಪದೇ ಪದೇ ಪರಿಶೀಲಿಸುವಂತೆ ಮಾಡುವುದು. ಇದಕ್ಕೆ ಹೆಚ್ಚಿನ ಲೆಕ್ಕಾಚಾರದ ಅಗತ್ಯವಿದೆ, ಅಂದರೆ ಹೆಚ್ಚಿನ ವೆಚ್ಚ.

ಏಜೆಂಟ್‌ನ ನಿಜವಾದ ವೆಚ್ಚ

24/7 ಉದ್ಯಮ-ದರ್ಜೆಯ ಏಜೆಂಟ್‌ನ ವಾರ್ಷಿಕ ವೆಚ್ಚ (ಪ್ರತಿ ದಿನ 20 ಮಿಲಿಯನ್ ಇನ್‌ಪುಟ್ + 20 ಮಿಲಿಯನ್ ಔಟ್‌ಪುಟ್ ಟೋಕನ್‌ಗಳು):

ಮಾದರಿ	ವಾರ್ಷಿಕ ವೆಚ್ಚ
Palmyra X5	~$48K
GPT-5.2 Standard	~$57K
Gemini 2.5 Pro	~$82K
Claude Sonnet 4.5	~$131K
Claude Opus 4.6	~$219K
GPT-5.2 Pro	~$690K

GPT-5.2 Pro, GPT-5.2 Standard ಗಿಂತ 12 ಪಟ್ಟು ಹೆಚ್ಚು ದುಬಾರಿಯಾಗಿದೆ. ಇದು ಬೆಲೆ ನಿಗದಿ ಮಾಡುವ ಸಮಸ್ಯೆಯಲ್ಲ, ಇದು ವೆಚ್ಚದ ರಚನೆಯ ಸಮಸ್ಯೆ.

"ನೀವು 100 AI ಏಜೆಂಟ್‌ಗಳನ್ನು ನಿಯೋಜಿಸುವ ಮೊದಲು, ಲೆಕ್ಕಾಚಾರವನ್ನು ಮಾಡಿ." — @waseem_s

ಹೊಸ ಟ್ಯೂರಿಂಗ್ ಪರೀಕ್ಷೆ

ಒಂದು ಸರಳ ಪ್ರಶ್ನೆಯು ಹೊಸ ಬುದ್ಧಿವಂತಿಕೆಯ ಪರೀಕ್ಷೆಯಾಗುತ್ತಿದೆ:

"ನನ್ನ ಮನೆಯಿಂದ ಕಾರ್ ವಾಶ್ ಅಂಗಡಿ 40 ಮೀಟರ್ ದೂರದಲ್ಲಿದೆ. ನಾನು ಕಾರ್ ವಾಶ್ ಮಾಡಲು ಹೋಗಲು ನಡೆದುಕೊಂಡು ಹೋಗಬೇಕೋ ಅಥವಾ ಕಾರಿನಲ್ಲಿ ಹೋಗಬೇಕೋ?"

ಉತ್ತೀರ್ಣರಾದ ಮಾದರಿಗಳು: GPT-5.2 Thinking, Opus 4.6, Gemini 3 Pro ವಿಫಲವಾದ ಮಾದರಿಗಳು: GPT-5.2 Instant, GPT-4o, Haiku 4.5, Sonnet 4.5

ಈ ಪರೀಕ್ಷೆಯು ಏಕೆ ಅರ್ಥಪೂರ್ಣವಾಗಿದೆ? ಏಕೆಂದರೆ ಇದು "ಸಾಮಾನ್ಯ ಜ್ಞಾನದ ತಾರ್ಕಿಕತೆ"ಯನ್ನು ಪರೀಕ್ಷಿಸುತ್ತದೆ, "ಜ್ಞಾನದ ಮರುಪಡೆಯುವಿಕೆ"ಯನ್ನಲ್ಲ. 40 ಮೀಟರ್ ಎಂದರೆ ನಡೆಯುವ ದೂರ. ಕಾರು ಕೊಳೆಯಾಗಿದ್ದರೆ ತೊಳೆಯಬೇಕು. ಆದರೆ ನೀವು ಕೊಳಕು ಕಾರನ್ನು 40 ಮೀಟರ್ ದೂರಕ್ಕೆ ತೊಳೆಯಲು ಓಡಿಸುವುದಿಲ್ಲ - ನಿಮಗೆ ಸಾಮಾನ್ಯ ಜ್ಞಾನವಿಲ್ಲದಿದ್ದರೆ ಮಾತ್ರ.

ಇತಿಹಾಸವು ಪುನರಾವರ್ತನೆಯಾಗುವುದಿಲ್ಲ, ಆದರೆ ಪ್ರಾಸಬದ್ಧವಾಗಿರುತ್ತದೆ

"ತಜ್ಞ ವ್ಯವಸ್ಥೆಗಳು 1970 ರ ದಶಕದಲ್ಲಿ ಜನಿಸಿದವು, 1980 ರ ದಶಕದಲ್ಲಿ ಅಭಿವೃದ್ಧಿ ಹೊಂದಿದವು ಮತ್ತು AI ನ ಭವಿಷ್ಯವೆಂದು ವ್ಯಾಪಕವಾಗಿ ಪರಿಗಣಿಸಲ್ಪಟ್ಟವು." — @ChombaBupe

GPT ಮಾದರಿಗಳು 2018 ರಲ್ಲಿ ಜನಿಸಿದವು, 2020 ರ ದಶಕದಲ್ಲಿ ಅಭಿವೃದ್ಧಿ ಹೊಂದಿದವು ಮತ್ತು AI ನ ಭವಿಷ್ಯವೆಂದು ವ್ಯಾಪಕವಾಗಿ ಪರಿಗಣಿಸಲ್ಪಟ್ಟವು.

ತಜ್ಞ ವ್ಯವಸ್ಥೆಗಳ ವೈಫಲ್ಯಕ್ಕೆ ಅವು ಸಾಕಷ್ಟು ಬುದ್ಧಿವಂತವಾಗಿಲ್ಲ ಎಂಬುದು ಕಾರಣವಲ್ಲ, ಆದರೆ ನಿರ್ವಹಣಾ ವೆಚ್ಚವು ತುಂಬಾ ಹೆಚ್ಚಾಗಿತ್ತು ಮತ್ತು ವಿಸ್ತರಣೆಯು ತುಂಬಾ ಕಳಪೆಯಾಗಿತ್ತು. ಜ್ಞಾನದ ಆಧಾರವನ್ನು ಕೈಯಿಂದ ನಿರ್ವಹಿಸಬೇಕಾದಾಗ, ಗಾತ್ರವೇ ಶತ್ರು.

GPT ಒಂದು ಕನ್ನಡಿಯ ಸಮಸ್ಯೆಯನ್ನು ಎದುರಿಸುತ್ತಿದೆ: ಮಾದರಿಯು ಬುದ್ಧಿವಂತವಾಗಿದೆ, ಆದರೆ ತಾರ್ಕಿಕ ವೆಚ್ಚವು ತುಂಬಾ ಹೆಚ್ಚಾಗಿದೆ. ಪ್ರತಿ ವಿನಂತಿಗೆ ಹೆಚ್ಚಿನ ಲೆಕ್ಕಾಚಾರದ ಅಗತ್ಯವಿದ್ದಾಗ, ಗಾತ್ರವು ಸಹ ಶತ್ರುವಾಗುತ್ತದೆ.

ಮುಂದೇನು

ಈ ವಾರ ಹಲವಾರು ಹೊಸ ಮಾದರಿಗಳನ್ನು ಬಿಡುಗಡೆ ಮಾಡುವ ನಿರೀಕ್ಷೆಯಿದೆ: Gemini 3.1 Pro, Claude Sonnet 5, GPT-5.3, DeepSeek V4, Qwen 3.5.

ಸ್ಪರ್ಧೆಯು "ಯಾರು ಹೆಚ್ಚು ಬುದ್ಧಿವಂತರು" ಎಂಬುದರಿಂದ "ಯಾರು ಅಗ್ಗದವರು" ಎಂಬುದಕ್ಕೆ ಬದಲಾಗುತ್ತಿದೆ. ಇದು ಬಳಕೆದಾರರಿಗೆ ಒಳ್ಳೆಯ ಸುದ್ದಿ. OpenAI ಗೆ? ಖಚಿತವಾಗಿ ಹೇಳಲಾಗುವುದಿಲ್ಲ.

GPT ಯ ವೆಚ್ಚದ ಗೋಡೆ

ARC-AGI: ಬುದ್ಧಿವಂತಿಕೆಯ ಗಡಿ

ಏಜೆಂಟ್‌ನ ನಿಜವಾದ ವೆಚ್ಚ

ಹೊಸ ಟ್ಯೂರಿಂಗ್ ಪರೀಕ್ಷೆ

ಇತಿಹಾಸವು ಪುನರಾವರ್ತನೆಯಾಗುವುದಿಲ್ಲ, ಆದರೆ ಪ್ರಾಸಬದ್ಧವಾಗಿರುತ್ತದೆ

ಮುಂದೇನು

You Might Also Like

Claude Code Buddy ಪರಿಷ್ಕರಣೆ ಮಾರ್ಗದರ್ಶಿ: ಹೇಗೆ ಹೊಳೆಯುವ ಪುರಾಣ ಮಟ್ಟದ ಪೆಟ್ನನ್ನು ಪಡೆಯುವುದು

Obsidian Defuddle ಅನ್ನು ಬಿಡುಗಡೆ ಮಾಡಿತು, Obsidian ವೆಬ್ ಕ್ಲಿಪ್ಪರ್ ಅನ್ನು ಹೊಸ ಎತ್ತರಕ್ಕೆ ತಂದುಕೊಂಡಿತು

ಅವರು ತೀವ್ರವಾಗಿ ತೂಕ ಕಡಿಮೆ ಮಾಡಲು ಪ್ರಯತ್ನಿಸುತ್ತಿರುವ ತಾಯಿಗಳು, ಖಂಡಿತವಾಗಿ ಇಲ್ಲಿ ಬಿದ್ದಿದ್ದಾರೆ

AI Browser 24 ಗಂಟೆಗಳ ಸ್ಥಿರ ಕಾರ್ಯಾಚರಣೆ ಮಾರ್ಗದರ್ಶಿ