Google அமைதியாக Deep Think ஐ மேம்படுத்தியது, ARC-AGI-2 நேரடியாக 84.6% ஐ எட்டியது

சமீபத்தில், Google DeepMind ஜெமினி 3 இன் பிரத்யேக அனுமான முறை Deep Think ஐ மேம்படுத்தியது, மதிப்பெண்கள் நேரடியாக தரவரிசையை அழித்தன.

Deep Think

ARC-AGI-2 தற்போது AI அனுமான திறனை சோதிக்கும் ஒரு முன்னணி அளவுகோலாக அங்கீகரிக்கப்பட்டுள்ளது என்பதை அறிந்து கொள்ளுங்கள், இதற்கு முன்பு எந்த மாதிரியும் இதில் குறிப்பாக நல்ல மதிப்பெண்களைப் பெற முடியவில்லை.

அளவுகோல் ஒப்பீடு

மேம்படுத்தப்பட்ட Deep Think 84.6% ஐப் பெற்றது, ஒப்பிட்டுப் பார்த்தால்: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, சொந்த ஜெமினி 3 Pro Preview கூட 31.1% மட்டுமே.

மிகப்பெரிய முன்னேற்றம்.

அனுமானத்தை விட அதிகம்

Deep Think இன் லட்சியம் அனுமானத்துடன் மட்டும் நின்றுவிடவில்லை.

அனுமானத்தை விட அதிகம்

Humanity's Last Exam எனப்படும் "மனிதகுலத்தின் கடைசி தேர்வு" என்ற அளவுகோலில், Deep Think 48.4% ஐப் பெற்றது, இந்த சோதனை கணிதம், அறிவியல் மற்றும் பொறியியல் துறைகளில் உள்ள கடினமான கேள்விகளை உள்ளடக்கியது. Claude Opus 4.6 - 40.0% பெற்றது, GPT-5.2 - 34.5%.

நிரலாக்கத்திலும் இது மிகவும் வலிமையானது:

Codeforces இல் Deep Think Elo 3455 ஐ எட்டியது, அதே நேரத்தில் ஜெமினி 3 Pro Preview 2512, Claude Opus 4.6 - 2352.

Codeforces

கூடுதலாக, பல மாதிரி புரிதல் மற்றும் அனுமானத்தின் MMMU-Pro அளவுகோலில், Deep Think 81.5% உடன் முன்னணியில் உள்ளது, ஆனால் இங்கே ஒவ்வொரு நிறுவனத்திற்கும் இடையிலான வித்தியாசம் அவ்வளவு பெரியதாக இல்லை: ஜெமினி 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

MMMU-Pro

மதிப்பெண்களைத் தவிர, Deep Think 2025 இயற்பியல் மற்றும் வேதியியல் ஒலிம்பியாட் போட்டிகளின் எழுத்துத் தேர்வில் தங்கப் பதக்கத்திற்கான தரத்தைப் பெற்றது.

அறிவியல் சிக்கல்களைத் தீர்க்க வேண்டும்

Google DeepMind இந்த முறை மேம்படுத்தப்பட்ட Deep Think ஒரு தீர்வு காணும் இயந்திரம் மட்டுமல்ல, உண்மையான உலக அறிவியல் மற்றும் பொறியியல் சிக்கல்களைத் தீர்க்க வேண்டும் என்பதை குறிப்பாக வலியுறுத்தியது.

அறிவியல் சிக்கல்கள்

Duke பல்கலைக்கழகத்தின் Wang Lab இன் உதாரணத்தை அவர்கள் காட்சிப்படுத்தினர்: ஆராய்ச்சியாளர்கள் புதிய குறைக்கடத்தி பொருட்களை வடிவமைக்க Deep Think ஐப் பயன்படுத்துகின்றனர், சிக்கலான படிகங்களின் வளர்ச்சியை மேம்படுத்துகின்றனர், இந்த படிகங்கள் அதிக வெப்பநிலை குறைக்கடத்திகளுக்கான சாத்தியமான பொருட்கள் ஆகும்.

Duke உதாரணம்

இயந்திர பொறியியல்

இயந்திர பொறியியல் துறையில் உள்ள ஆராய்ச்சியாளர்கள் இயற்பியல் முன்மாதிரிகளை மீண்டும் உருவாக்க இதைப் பயன்படுத்துகின்றனர், வன்பொருள் மறு செய்கை வேகத்தை மென்பொருள் மறு செய்கை வேகத்தை எட்ட வைக்கிறது, இது உதவி சாதனங்கள் போன்ற துறைகளில் விரைவான முன்னேற்ற சுழற்சிகளைக் குறிக்கிறது.

எப்படி உபயோகிப்பது

மேம்படுத்தப்பட்ட Deep Think முறை இப்போது Google AI Ultra சந்தாதாரர்களுக்கு ஜெமினி பயன்பாட்டில் வெளியிடத் தொடங்கியுள்ளது.

எப்படி உபயோகிப்பது

ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்களுக்கு, Google Vertex AI ஆரம்ப அணுகல் திட்டத்தை திறந்துள்ளது, இதை API மூலம் பயன்படுத்தலாம்.

Vertex AI ஆரம்ப அணுகல்: https://goo.gle/4rMHUlq

Google அமைதியாக Deep Think ஐ மேம்படுத்தியது, ARC-AGI-2 நேரடியாக 84.6% ஐ எட்டியது

Google அமைதியாக Deep Think ஐ மேம்படுத்தியது, ARC-AGI-2 நேரடியாக 84.6% ஐ எட்டியது

அனுமானத்தை விட அதிகம்

அறிவியல் சிக்கல்களைத் தீர்க்க வேண்டும்

எப்படி உபயோகிப்பது

You Might Also Like

Claude Code Buddy மாற்றம் வழிகாட்டி: எவ்வாறு மின்ன闪传说 நிலை செல்லப்பிராணிகளை பெறுவது

Obsidian வெளியிட்ட Defuddle, Obsidian Web Clipper-ஐ புதிய உயரத்திற்கு கொண்டு சென்றது

2026, உங்களை 'சுய கட்டுப்பாடு' செய்ய அழைக்காதீர்கள்! இந்த 8 சிறிய விஷயங்களைச் செய்யுங்கள், ஆரோக்கியம் தானாகவே வரும்

அந்த முயற்சியுடன் எடை குறைக்க முயற்சிக்கும் அம்மாக்கள், இங்கே தவறுகிறார்கள்

AI Browser 24 மணி நேர நிலையான இயக்கம் வழிகாட்டி