谷歌发布重大升级模型 DeepThink,清华系姚顺宇参与,从业者称是“外星智能”
2 月 13 日,谷歌发布了 Gemini3DeepThink 的重大升级,作为专门用于复杂任务的推理模式,DeepThink 旨在解决科学、工程领域的诸多挑战。在多项基准测试中,DeepThink 创下新纪录,超越了 ClaudeOpus4.6 和 GPT-5.2。模型在“人类最后的考试”测试中取得了 48.4%的成绩,在 ARC-AGI-2 测试中取得了 84.6%的成绩,相当于在全球编程能力上能排进前 8。此外,DeepThink 在化学和物理等科学领域表现出色,甚至在 2025 年国际物理和化学奥林匹克竞赛的笔试部分取得了金牌级别的成绩。
 
 
Back to Top