Google, Deep Think'i Sessizce Yükseltti, ARC-AGI-2 Doğrudan %84.6'ya Ulaştı
Google, Deep Think'i Sessizce Yükseltti, ARC-AGI-2 Doğrudan %84.6'ya Ulaştı
Google DeepMind az önce Gemini 3'ün özel çıkarım modu Deep Think'i yükseltti, puanlar doğrudan listeleri alt üst etti.

Bilinmelidir ki, ARC-AGI-2 şu anda yapay zeka çıkarım yeteneğini test etmek için kabul gören en ileri standarttır ve daha önce hiçbir model bu konuda özellikle iyi puanlar alamamıştı.
(Temel Karşılaştırma)
Yükseltilmiş Deep Think %84.6 aldı, karşılaştıralım: Claude Opus 4.6 %68.8, GPT-5.2 %52.9 ve hatta kendi Gemini 3 Pro Preview'i bile sadece %31.1.
Büyük gelişme.
Sadece Çıkarım Değil
Deep Think'in hırsı açıkça çıkarımın ötesinde.
(Sadece Çıkarım Değil)
"İnsanlığın Son Sınavı" olarak adlandırılan Humanity's Last Exam standardında Deep Think %48.4 aldı, bu test matematik, bilim ve mühendislik alanlarındaki en zor soruları kapsıyor. Claude Opus 4.6 %40.0, GPT-5.2 %34.5 aldı.
Programlama tarafı da çok güçlü:
Codeforces'ta Deep Think Elo 3455'e ulaştı, Gemini 3 Pro Preview 2512, Claude Opus 4.6 ise 2352.

Ek olarak, çok modlu anlama ve çıkarım için kullanılan MMMU-Pro standardında Deep Think %81.5 ile lider durumda, ancak buradaki farklar o kadar büyük değil: Gemini 3 Pro Preview %81.0, GPT-5.2 %79.5, Claude Opus 4.6 %73.9.

Puanların yanı sıra, Deep Think ayrıca 2025 Fizik ve Kimya Olimpiyatları'nın yazılı sınav bölümünde altın madalya seviyesinde bir sonuç elde etti.
Bilimsel Sorunları Çözmek
Google DeepMind bu sefer özellikle, yükseltilmiş Deep Think'in artık sadece bir problem çözme makinesi olmadığını, gerçek dünyadaki bilimsel ve mühendislik sorunlarını çözmek istediğini vurguladı.
(Bilimsel Sorunlar)
Duke Üniversitesi Wang Lab'ın örneğini gösterdiler: Araştırmacılar, yeni yarı iletken malzemeler tasarlamak ve karmaşık kristallerin büyüme sürecini optimize etmek için Deep Think'i kullanıyorlar; bu kristaller yüksek sıcaklık yarı iletkenleri için aday malzemelerdir.
(Duke Örneği)
(Makine Mühendisliği)
Ayrıca makine mühendisliği alanındaki araştırmacılar, fiziksel prototipleri yinelemek için onu kullanıyor, böylece donanım yinelemesi yazılım yinelemesi hızına ulaşıyor, bu da yardımcı cihazlar gibi alanlarda daha hızlı iyileştirme döngüleri anlamına geliyor.
Nasıl Kullanılır
Yükseltilmiş Deep Think modu artık Gemini Uygulamasında Google AI Ultra abonelerine sunulmaya başlandı.
(Nasıl Kullanılır)
Araştırmacılar ve geliştiriciler için Google, API aracılığıyla kullanılabilen Vertex AI erken erişim programını açtı.
Vertex AI erken erişimi: https://goo.gle/4rMHUlq





