Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%

Μόλις τώρα, η Google DeepMind αναβάθμισε την ειδική λειτουργία συμπερασμού του Gemini 3, Deep Think, και τα σκορ εκτοξεύθηκαν στην κορυφή.

Deep Think

Να γνωρίζετε ότι το ARC-AGI-2 είναι ένα αναγνωρισμένο σημείο αναφοράς για τη δοκιμή των ικανοτήτων συμπερασμού της τεχνητής νοημοσύνης, και κανένα μοντέλο δεν είχε καταφέρει να πάρει ιδιαίτερα καλή βαθμολογία σε αυτό.

Σύγκριση σημείων αναφοράς

Ενώ το αναβαθμισμένο Deep Think έλαβε 84,6%, σε σύγκριση: το Claude Opus 4.6 είναι 68,8%, το GPT-5.2 είναι 52,9%, και ακόμη και το δικό τους Gemini 3 Pro Preview είναι μόλις 31,1%.

Τεράστια βελτίωση.

Όχι μόνο συμπερασμός

Οι φιλοδοξίες του Deep Think είναι σαφώς περισσότερες από τον απλό συμπερασμό.

Όχι μόνο συμπερασμός

Στο Humanity's Last Exam, ένα σημείο αναφοράς που ονομάζεται «η τελευταία εξέταση της ανθρωπότητας», το Deep Think έλαβε 48,4%. Αυτή η δοκιμή καλύπτει τα πιο δύσκολα προβλήματα στα μαθηματικά, τις επιστήμες και τη μηχανική. Το Claude Opus 4.6 έλαβε 40,0% και το GPT-5.2 34,5%.

Ο προγραμματισμός είναι επίσης πολύ δυνατός:

Στο Codeforces, το Deep Think έφτασε στο Elo 3455, ενώ το Gemini 3 Pro Preview είναι 2512 και το Claude Opus 4.6 είναι 2352.

Codeforces

Επιπλέον, στο σημείο αναφοράς MMMU-Pro για πολυτροπική κατανόηση και συμπερασμό, το Deep Think προηγείται επίσης με 81,5%, αλλά εδώ οι διαφορές μεταξύ των εταιρειών δεν είναι τόσο μεγάλες: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Εκτός από τα σκορ, το Deep Think έλαβε επίσης επίπεδο χρυσού μεταλλίου στο γραπτό μέρος των Ολυμπιακών Αγώνων Φυσικής και Χημείας του 2025.

Για την επίλυση επιστημονικών προβλημάτων

Η Google DeepMind τόνισε ιδιαίτερα αυτή τη φορά ότι το αναβαθμισμένο Deep Think δεν είναι πλέον απλώς μια μηχανή επίλυσης προβλημάτων, αλλά πρόκειται να λύσει πραγματικά επιστημονικά και μηχανικά προβλήματα.

Επιστημονικά προβλήματα

Παρουσίασαν την περίπτωση του Wang Lab του Πανεπιστημίου Duke: οι ερευνητές χρησιμοποίησαν το Deep Think για να σχεδιάσουν νέα υλικά ημιαγωγών και να βελτιστοποιήσουν τη διαδικασία ανάπτυξης σύνθετων κρυστάλλων, οι οποίοι είναι υποψήφια υλικά ημιαγωγών υψηλής θερμοκρασίας.

Duke案例

Μηχανολογία

Επιπλέον, ερευνητές στον τομέα της μηχανολογίας το χρησιμοποιούν για να επαναλάβουν φυσικά πρωτότυπα, επιτρέποντας στην επανάληψη υλικού να φτάσει την ταχύτητα της επανάληψης λογισμικού, γεγονός που σημαίνει ταχύτερους κύκλους βελτίωσης σε τομείς όπως οι βοηθητικές συσκευές.

Πώς να χρησιμοποιήσετε

Η αναβαθμισμένη λειτουργία Deep Think έχει πλέον αρχίσει να προωθείται στην εφαρμογή Gemini σε συνδρομητές Google AI Ultra.

Πώς να χρησιμοποιήσετε

Για ερευνητές και προγραμματιστές, η Google άνοιξε ένα πρόγραμμα πρώιμης πρόσβασης Vertex AI, το οποίο μπορεί να χρησιμοποιηθεί μέσω API.

Vertex AI 早期访问：https://goo.gle/4rMHUlq

Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%

Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%

Όχι μόνο συμπερασμός

Για την επίλυση επιστημονικών προβλημάτων

Πώς να χρησιμοποιήσετε

You Might Also Like

Claude Code Buddy 修改指南：如何获得闪光传说级宠物

Obsidian παρουσίασε το Defuddle, ανεβάζοντας το Obsidian Web Clipper σε νέο επίπεδο

OpenAI ξαφνικά ανακοινώνει "τρίο σε ένα": Συνδυασμός περιηγητή + προγραμματισμού + ChatGPT, παραδέχεται ότι έκανε λάθος τον τελευταίο χρόνο

2026, μην πιέζεις τον εαυτό σου να είναι "πειθαρχημένος"! Κάνε αυτές τις 8 μικρές κινήσεις και η υγεία θα έρθει φυσικά

Οι μητέρες που προσπαθούν να χάσουν βάρος αλλά δεν τα καταφέρνουν, σίγουρα έχουν κολλήσει εδώ

AI Browser 24小时稳定运行指南