
从“立即回答的AI”到“思考后回答的AI”
提到生成式AI,许多人会联想到输入问题后立即得到答案的场景。然而,近年来,花费更多时间“先思考再回答”的AI类型逐渐受到关注,这就是所谓的“推理模型(Reasoning Model)”。
例如,在让最新AI解答日本东京大学和京都大学的二次考试题目时,据报道,ChatGPT 5.2 Thinking和Gemini 3 Pro Preview在东京大学所有科类及京都大学几乎所有学部和学科中,成绩超过了合格者的最高分,甚至在数学等科目中取得满分。这显示了AI推理能力的快速提升。
这类成果不仅仅是因为AI知识量的增加,更重要的是AI开始将复杂问题拆分成多个步骤进行思考,而非直接给出答案。
什么是推理模型?
推理模型指的是面对复杂问题时,不立即得出结论,而是通过多个步骤逐步推导答案的AI模型。
以数学题为例,AI不会直接写出答案,而是先整理条件、建立必要的公式、确认中间结果,逐步进行推理。编程时,AI会先理解需求,拆解处理流程,编写代码,必要时还会进行测试。
这类似于人类解决难题时在纸上写下中间步骤、整理条件的做法。
什么是CoT?
在理解推理模型时,经常会遇到“CoT(Chain-of-Thought,思维链)”这一概念。
CoT是一种让AI不仅给出结论,还能逐步构建思考过程的方法。例如,指示AI“请一步步思考”,可以帮助AI将问题细分,便于推理。
不过,目前推理模型内部的思考过程并非完全透明,CoT虽然是重要思路,但不能简单地认为推理模型的所有内容都能用CoT解释。
实际上,推理模型还可能结合尝试多种解法、验证中间结果、选择最佳答案等机制。
推理需要成本
推理模型在数学、编程、逻辑分析、复杂商业决策等领域表现出色,但思考时间越长,所需计算资源也越多。
让AI长时间思考意味着处理更多的token,数据中心的计算机运行时间也更长。比如,GitHub Copilot宣布自2026年6月1日起,将采用基于token消耗量的“GitHub AI积分”计费方式。随着AI能力提升,收费模式也越来越接近“按使用量计费”。
是否所有问题都适合推理模型?
那么,是否所有问题都应交由推理模型处理呢?答案是否定的。
对于简单问题或需要快速回答的场景,普通的高速模型已经足够;而在数学、设计、代码修改、多条件比较、重要决策准备等复杂任务中,推理模型则更具优势。
因此,推理模型更适合作为“遇到难题时细致思考的高级模式”,而非“随时使用的万能模式”。
AI正从单纯的答题工具,逐步演变为支持思考过程的助手,而“推理模型”正是这一变革的象征。


