Google, Deep Think'i Sessizce Yükseltti, ARC-AGI-2 Doğrudan %84.6'ya Ulaştı

2/14/2026
2 min read

Google, Deep Think'i Sessizce Yükseltti, ARC-AGI-2 Doğrudan %84.6'ya Ulaştı

Google DeepMind az önce Gemini 3'ün özel çıkarım modu Deep Think'i yükseltti, puanlar doğrudan listeleri alt üst etti.

Deep Think

Bilinmelidir ki, ARC-AGI-2 şu anda yapay zeka çıkarım yeteneğini test etmek için kabul gören en ileri standarttır ve daha önce hiçbir model bu konuda özellikle iyi puanlar alamamıştı.

基准对比 (Temel Karşılaştırma)

Yükseltilmiş Deep Think %84.6 aldı, karşılaştıralım: Claude Opus 4.6 %68.8, GPT-5.2 %52.9 ve hatta kendi Gemini 3 Pro Preview'i bile sadece %31.1.

Büyük gelişme.

Sadece Çıkarım Değil

Deep Think'in hırsı açıkça çıkarımın ötesinde.

不止推理 (Sadece Çıkarım Değil)

"İnsanlığın Son Sınavı" olarak adlandırılan Humanity's Last Exam standardında Deep Think %48.4 aldı, bu test matematik, bilim ve mühendislik alanlarındaki en zor soruları kapsıyor. Claude Opus 4.6 %40.0, GPT-5.2 %34.5 aldı.

Programlama tarafı da çok güçlü:

Codeforces'ta Deep Think Elo 3455'e ulaştı, Gemini 3 Pro Preview 2512, Claude Opus 4.6 ise 2352.

Codeforces

Ek olarak, çok modlu anlama ve çıkarım için kullanılan MMMU-Pro standardında Deep Think %81.5 ile lider durumda, ancak buradaki farklar o kadar büyük değil: Gemini 3 Pro Preview %81.0, GPT-5.2 %79.5, Claude Opus 4.6 %73.9.

MMMU-Pro

Puanların yanı sıra, Deep Think ayrıca 2025 Fizik ve Kimya Olimpiyatları'nın yazılı sınav bölümünde altın madalya seviyesinde bir sonuç elde etti.

Bilimsel Sorunları Çözmek

Google DeepMind bu sefer özellikle, yükseltilmiş Deep Think'in artık sadece bir problem çözme makinesi olmadığını, gerçek dünyadaki bilimsel ve mühendislik sorunlarını çözmek istediğini vurguladı.

科学问题 (Bilimsel Sorunlar)

Duke Üniversitesi Wang Lab'ın örneğini gösterdiler: Araştırmacılar, yeni yarı iletken malzemeler tasarlamak ve karmaşık kristallerin büyüme sürecini optimize etmek için Deep Think'i kullanıyorlar; bu kristaller yüksek sıcaklık yarı iletkenleri için aday malzemelerdir.

Duke案例 (Duke Örneği)

机械工程 (Makine Mühendisliği)

Ayrıca makine mühendisliği alanındaki araştırmacılar, fiziksel prototipleri yinelemek için onu kullanıyor, böylece donanım yinelemesi yazılım yinelemesi hızına ulaşıyor, bu da yardımcı cihazlar gibi alanlarda daha hızlı iyileştirme döngüleri anlamına geliyor.

Nasıl Kullanılır

Yükseltilmiş Deep Think modu artık Gemini Uygulamasında Google AI Ultra abonelerine sunulmaya başlandı.

如何使用 (Nasıl Kullanılır)

Araştırmacılar ve geliştiriciler için Google, API aracılığıyla kullanılabilen Vertex AI erken erişim programını açtı.

Vertex AI erken erişimi: https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like