Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%
Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%
Μόλις τώρα, η Google DeepMind αναβάθμισε την ειδική λειτουργία συμπερασμού του Gemini 3, Deep Think, και τα σκορ εκτοξεύθηκαν στην κορυφή.

Να γνωρίζετε ότι το ARC-AGI-2 είναι ένα αναγνωρισμένο σημείο αναφοράς για τη δοκιμή των ικανοτήτων συμπερασμού της τεχνητής νοημοσύνης, και κανένα μοντέλο δεν είχε καταφέρει να πάρει ιδιαίτερα καλή βαθμολογία σε αυτό.

Ενώ το αναβαθμισμένο Deep Think έλαβε 84,6%, σε σύγκριση: το Claude Opus 4.6 είναι 68,8%, το GPT-5.2 είναι 52,9%, και ακόμη και το δικό τους Gemini 3 Pro Preview είναι μόλις 31,1%.
Τεράστια βελτίωση.
Όχι μόνο συμπερασμός
Οι φιλοδοξίες του Deep Think είναι σαφώς περισσότερες από τον απλό συμπερασμό.

Στο Humanity's Last Exam, ένα σημείο αναφοράς που ονομάζεται «η τελευταία εξέταση της ανθρωπότητας», το Deep Think έλαβε 48,4%. Αυτή η δοκιμή καλύπτει τα πιο δύσκολα προβλήματα στα μαθηματικά, τις επιστήμες και τη μηχανική. Το Claude Opus 4.6 έλαβε 40,0% και το GPT-5.2 34,5%.
Ο προγραμματισμός είναι επίσης πολύ δυνατός:
Στο Codeforces, το Deep Think έφτασε στο Elo 3455, ενώ το Gemini 3 Pro Preview είναι 2512 και το Claude Opus 4.6 είναι 2352.

Επιπλέον, στο σημείο αναφοράς MMMU-Pro για πολυτροπική κατανόηση και συμπερασμό, το Deep Think προηγείται επίσης με 81,5%, αλλά εδώ οι διαφορές μεταξύ των εταιρειών δεν είναι τόσο μεγάλες: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

Εκτός από τα σκορ, το Deep Think έλαβε επίσης επίπεδο χρυσού μεταλλίου στο γραπτό μέρος των Ολυμπιακών Αγώνων Φυσικής και Χημείας του 2025.
Για την επίλυση επιστημονικών προβλημάτων
Η Google DeepMind τόνισε ιδιαίτερα αυτή τη φορά ότι το αναβαθμισμένο Deep Think δεν είναι πλέον απλώς μια μηχανή επίλυσης προβλημάτων, αλλά πρόκειται να λύσει πραγματικά επιστημονικά και μηχανικά προβλήματα.

Παρουσίασαν την περίπτωση του Wang Lab του Πανεπιστημίου Duke: οι ερευνητές χρησιμοποίησαν το Deep Think για να σχεδιάσουν νέα υλικά ημιαγωγών και να βελτιστοποιήσουν τη διαδικασία ανάπτυξης σύνθετων κρυστάλλων, οι οποίοι είναι υποψήφια υλικά ημιαγωγών υψηλής θερμοκρασίας.


Επιπλέον, ερευνητές στον τομέα της μηχανολογίας το χρησιμοποιούν για να επαναλάβουν φυσικά πρωτότυπα, επιτρέποντας στην επανάληψη υλικού να φτάσει την ταχύτητα της επανάληψης λογισμικού, γεγονός που σημαίνει ταχύτερους κύκλους βελτίωσης σε τομείς όπως οι βοηθητικές συσκευές.
Πώς να χρησιμοποιήσετε
Η αναβαθμισμένη λειτουργία Deep Think έχει πλέον αρχίσει να προωθείται στην εφαρμογή Gemini σε συνδρομητές Google AI Ultra.

Για ερευνητές και προγραμματιστές, η Google άνοιξε ένα πρόγραμμα πρώιμης πρόσβασης Vertex AI, το οποίο μπορεί να χρησιμοποιηθεί μέσω API.
Vertex AI 早期访问:https://goo.gle/4rMHUlq





