Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%

2/14/2026
3 min read

Η Google αναβάθμισε αθόρυβα το Deep Think, το ARC-AGI-2 έφτασε απευθείας στο 84,6%

Μόλις τώρα, η Google DeepMind αναβάθμισε την ειδική λειτουργία συμπερασμού του Gemini 3, Deep Think, και τα σκορ εκτοξεύθηκαν στην κορυφή.

Deep Think

Να γνωρίζετε ότι το ARC-AGI-2 είναι ένα αναγνωρισμένο σημείο αναφοράς για τη δοκιμή των ικανοτήτων συμπερασμού της τεχνητής νοημοσύνης, και κανένα μοντέλο δεν είχε καταφέρει να πάρει ιδιαίτερα καλή βαθμολογία σε αυτό.

Σύγκριση σημείων αναφοράς

Ενώ το αναβαθμισμένο Deep Think έλαβε 84,6%, σε σύγκριση: το Claude Opus 4.6 είναι 68,8%, το GPT-5.2 είναι 52,9%, και ακόμη και το δικό τους Gemini 3 Pro Preview είναι μόλις 31,1%.

Τεράστια βελτίωση.

Όχι μόνο συμπερασμός

Οι φιλοδοξίες του Deep Think είναι σαφώς περισσότερες από τον απλό συμπερασμό.

Όχι μόνο συμπερασμός

Στο Humanity's Last Exam, ένα σημείο αναφοράς που ονομάζεται «η τελευταία εξέταση της ανθρωπότητας», το Deep Think έλαβε 48,4%. Αυτή η δοκιμή καλύπτει τα πιο δύσκολα προβλήματα στα μαθηματικά, τις επιστήμες και τη μηχανική. Το Claude Opus 4.6 έλαβε 40,0% και το GPT-5.2 34,5%.

Ο προγραμματισμός είναι επίσης πολύ δυνατός:

Στο Codeforces, το Deep Think έφτασε στο Elo 3455, ενώ το Gemini 3 Pro Preview είναι 2512 και το Claude Opus 4.6 είναι 2352.

Codeforces

Επιπλέον, στο σημείο αναφοράς MMMU-Pro για πολυτροπική κατανόηση και συμπερασμό, το Deep Think προηγείται επίσης με 81,5%, αλλά εδώ οι διαφορές μεταξύ των εταιρειών δεν είναι τόσο μεγάλες: Gemini 3 Pro Preview 81,0%, GPT-5.2 79,5%, Claude Opus 4.6 73,9%.

MMMU-Pro

Εκτός από τα σκορ, το Deep Think έλαβε επίσης επίπεδο χρυσού μεταλλίου στο γραπτό μέρος των Ολυμπιακών Αγώνων Φυσικής και Χημείας του 2025.

Για την επίλυση επιστημονικών προβλημάτων

Η Google DeepMind τόνισε ιδιαίτερα αυτή τη φορά ότι το αναβαθμισμένο Deep Think δεν είναι πλέον απλώς μια μηχανή επίλυσης προβλημάτων, αλλά πρόκειται να λύσει πραγματικά επιστημονικά και μηχανικά προβλήματα.

Επιστημονικά προβλήματα

Παρουσίασαν την περίπτωση του Wang Lab του Πανεπιστημίου Duke: οι ερευνητές χρησιμοποίησαν το Deep Think για να σχεδιάσουν νέα υλικά ημιαγωγών και να βελτιστοποιήσουν τη διαδικασία ανάπτυξης σύνθετων κρυστάλλων, οι οποίοι είναι υποψήφια υλικά ημιαγωγών υψηλής θερμοκρασίας.

Duke案例

Μηχανολογία

Επιπλέον, ερευνητές στον τομέα της μηχανολογίας το χρησιμοποιούν για να επαναλάβουν φυσικά πρωτότυπα, επιτρέποντας στην επανάληψη υλικού να φτάσει την ταχύτητα της επανάληψης λογισμικού, γεγονός που σημαίνει ταχύτερους κύκλους βελτίωσης σε τομείς όπως οι βοηθητικές συσκευές.

Πώς να χρησιμοποιήσετε

Η αναβαθμισμένη λειτουργία Deep Think έχει πλέον αρχίσει να προωθείται στην εφαρμογή Gemini σε συνδρομητές Google AI Ultra.

Πώς να χρησιμοποιήσετε

Για ερευνητές και προγραμματιστές, η Google άνοιξε ένα πρόγραμμα πρώιμης πρόσβασης Vertex AI, το οποίο μπορεί να χρησιμοποιηθεί μέσω API.

Vertex AI 早期访问:https://goo.gle/4rMHUlq

Published in Technology

You Might Also Like

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφουςTechnology

Πώς να χρησιμοποιήσετε την τεχνολογία υπολογιστικού νέφους: Ο πλήρης οδηγός για την κατασκευή της πρώτης σας υποδομής νέφους

[[HTMLPLACEHOLDER0]] [[HTMLPLACEHOLDER1]] [[HTMLPLACEHOLDER2]] [[HTMLPLACEHOLDER3]] [[HTMLPLACEHOLDER4]] [[HTMLPLACEHOLD...

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστείTechnology

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξαφανιστεί

Προειδοποίηση! Ο πατέρας του Claude Code δηλώνει: Σε 1 μήνα, χωρίς το Plan Mode, ο τίτλος του λογισμικού μηχανικού θα εξ...

2026年 Top 10 深度学习资源推荐Technology

2026年 Top 10 深度学习资源推荐

2026年 Top 10 深度学习资源推荐 随着深度学习在各个领域的迅速发展,越来越多的学习资源和工具涌现出来。本文将为您推荐2026年最值得关注的十个深度学习资源,帮助您在这一领域中快速成长。 1. Coursera Deep Learn...

2026年 Top 10 AI 代理:核心卖点解析Technology

2026年 Top 10 AI 代理:核心卖点解析

2026年 Top 10 AI 代理:核心卖点解析 引言 Με την ταχεία ανάπτυξη της τεχνητής νοημοσύνης, οι AI代理 (AI Agents) έχουν γίνει ένα καυτό θ...

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力Technology

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力

2026年 Top 10 AI 工具推荐:释放人工智能的真正潜力 在技术飞速发展的今天,人工智能(AI)已成为各行各业的热门话题。从医疗健康到金融服务,从教育到娱乐,AI 工具正在改变我们工作的方式。为此,我们整理出2026年值得关注的十大...

2026年 Top 10 AWS工具和资源推荐Technology

2026年 Top 10 AWS工具和资源推荐

2026年 Top 10 AWS工具和资源推荐 在快速发展的云计算领域,Amazon Web Services (AWS) 一直是领军者,提供丰富的服务和工具,帮助开发者、企业和技术专家在云上有效工作。以下是2026年值得关注的十大AWS工...