Google அமைதியாக Deep Think ஐ மேம்படுத்தியது, ARC-AGI-2 நேரடியாக 84.6% ஐ எட்டியது
Google அமைதியாக Deep Think ஐ மேம்படுத்தியது, ARC-AGI-2 நேரடியாக 84.6% ஐ எட்டியது
சமீபத்தில், Google DeepMind ஜெமினி 3 இன் பிரத்யேக அனுமான முறை Deep Think ஐ மேம்படுத்தியது, மதிப்பெண்கள் நேரடியாக தரவரிசையை அழித்தன.

ARC-AGI-2 தற்போது AI அனுமான திறனை சோதிக்கும் ஒரு முன்னணி அளவுகோலாக அங்கீகரிக்கப்பட்டுள்ளது என்பதை அறிந்து கொள்ளுங்கள், இதற்கு முன்பு எந்த மாதிரியும் இதில் குறிப்பாக நல்ல மதிப்பெண்களைப் பெற முடியவில்லை.

மேம்படுத்தப்பட்ட Deep Think 84.6% ஐப் பெற்றது, ஒப்பிட்டுப் பார்த்தால்: Claude Opus 4.6 - 68.8%, GPT-5.2 - 52.9%, சொந்த ஜெமினி 3 Pro Preview கூட 31.1% மட்டுமே.
மிகப்பெரிய முன்னேற்றம்.
அனுமானத்தை விட அதிகம்
Deep Think இன் லட்சியம் அனுமானத்துடன் மட்டும் நின்றுவிடவில்லை.

Humanity's Last Exam எனப்படும் "மனிதகுலத்தின் கடைசி தேர்வு" என்ற அளவுகோலில், Deep Think 48.4% ஐப் பெற்றது, இந்த சோதனை கணிதம், அறிவியல் மற்றும் பொறியியல் துறைகளில் உள்ள கடினமான கேள்விகளை உள்ளடக்கியது. Claude Opus 4.6 - 40.0% பெற்றது, GPT-5.2 - 34.5%.
நிரலாக்கத்திலும் இது மிகவும் வலிமையானது:
Codeforces இல் Deep Think Elo 3455 ஐ எட்டியது, அதே நேரத்தில் ஜெமினி 3 Pro Preview 2512, Claude Opus 4.6 - 2352.

கூடுதலாக, பல மாதிரி புரிதல் மற்றும் அனுமானத்தின் MMMU-Pro அளவுகோலில், Deep Think 81.5% உடன் முன்னணியில் உள்ளது, ஆனால் இங்கே ஒவ்வொரு நிறுவனத்திற்கும் இடையிலான வித்தியாசம் அவ்வளவு பெரியதாக இல்லை: ஜெமினி 3 Pro Preview 81.0%, GPT-5.2 79.5%, Claude Opus 4.6 73.9%.

மதிப்பெண்களைத் தவிர, Deep Think 2025 இயற்பியல் மற்றும் வேதியியல் ஒலிம்பியாட் போட்டிகளின் எழுத்துத் தேர்வில் தங்கப் பதக்கத்திற்கான தரத்தைப் பெற்றது.
அறிவியல் சிக்கல்களைத் தீர்க்க வேண்டும்
Google DeepMind இந்த முறை மேம்படுத்தப்பட்ட Deep Think ஒரு தீர்வு காணும் இயந்திரம் மட்டுமல்ல, உண்மையான உலக அறிவியல் மற்றும் பொறியியல் சிக்கல்களைத் தீர்க்க வேண்டும் என்பதை குறிப்பாக வலியுறுத்தியது.

Duke பல்கலைக்கழகத்தின் Wang Lab இன் உதாரணத்தை அவர்கள் காட்சிப்படுத்தினர்: ஆராய்ச்சியாளர்கள் புதிய குறைக்கடத்தி பொருட்களை வடிவமைக்க Deep Think ஐப் பயன்படுத்துகின்றனர், சிக்கலான படிகங்களின் வளர்ச்சியை மேம்படுத்துகின்றனர், இந்த படிகங்கள் அதிக வெப்பநிலை குறைக்கடத்திகளுக்கான சாத்தியமான பொருட்கள் ஆகும்.


இயந்திர பொறியியல் துறையில் உள்ள ஆராய்ச்சியாளர்கள் இயற்பியல் முன்மாதிரிகளை மீண்டும் உருவாக்க இதைப் பயன்படுத்துகின்றனர், வன்பொருள் மறு செய்கை வேகத்தை மென்பொருள் மறு செய்கை வேகத்தை எட்ட வைக்கிறது, இது உதவி சாதனங்கள் போன்ற துறைகளில் விரைவான முன்னேற்ற சுழற்சிகளைக் குறிக்கிறது.
எப்படி உபயோகிப்பது
மேம்படுத்தப்பட்ட Deep Think முறை இப்போது Google AI Ultra சந்தாதாரர்களுக்கு ஜெமினி பயன்பாட்டில் வெளியிடத் தொடங்கியுள்ளது.

ஆராய்ச்சியாளர்கள் மற்றும் டெவலப்பர்களுக்கு, Google Vertex AI ஆரம்ப அணுகல் திட்டத்தை திறந்துள்ளது, இதை API மூலம் பயன்படுத்தலாம்.
Vertex AI ஆரம்ப அணுகல்: https://goo.gle/4rMHUlq

