第5回推理模型——“先思考后回答”的AI

推理模型示意图

从“立即回答的AI”到“思考后回答的AI”

提到生成式AI，许多人会联想到输入问题后立即得到答案的场景。然而，近年来，花费更多时间“先思考再回答”的AI类型逐渐受到关注，这就是所谓的“推理模型（Reasoning Model）”。

例如，在让最新AI解答日本东京大学和京都大学的二次考试题目时，据报道，ChatGPT 5.2 Thinking和Gemini 3 Pro Preview在东京大学所有科类及京都大学几乎所有学部和学科中，成绩超过了合格者的最高分，甚至在数学等科目中取得满分。这显示了AI推理能力的快速提升。

这类成果不仅仅是因为AI知识量的增加，更重要的是AI开始将复杂问题拆分成多个步骤进行思考，而非直接给出答案。

推理模型指的是面对复杂问题时，不立即得出结论，而是通过多个步骤逐步推导答案的AI模型。

以数学题为例，AI不会直接写出答案，而是先整理条件、建立必要的公式、确认中间结果，逐步进行推理。编程时，AI会先理解需求，拆解处理流程，编写代码，必要时还会进行测试。

这类似于人类解决难题时在纸上写下中间步骤、整理条件的做法。

在理解推理模型时，经常会遇到“CoT（Chain-of-Thought，思维链）”这一概念。

CoT是一种让AI不仅给出结论，还能逐步构建思考过程的方法。例如，指示AI“请一步步思考”，可以帮助AI将问题细分，便于推理。

不过，目前推理模型内部的思考过程并非完全透明，CoT虽然是重要思路，但不能简单地认为推理模型的所有内容都能用CoT解释。

实际上，推理模型还可能结合尝试多种解法、验证中间结果、选择最佳答案等机制。

推理模型在数学、编程、逻辑分析、复杂商业决策等领域表现出色，但思考时间越长，所需计算资源也越多。

让AI长时间思考意味着处理更多的token，数据中心的计算机运行时间也更长。比如，GitHub Copilot宣布自2026年6月1日起，将采用基于token消耗量的“GitHub AI积分”计费方式。随着AI能力提升，收费模式也越来越接近“按使用量计费”。

那么，是否所有问题都应交由推理模型处理呢？答案是否定的。

对于简单问题或需要快速回答的场景，普通的高速模型已经足够；而在数学、设计、代码修改、多条件比较、重要决策准备等复杂任务中，推理模型则更具优势。

因此，推理模型更适合作为“遇到难题时细致思考的高级模式”，而非“随时使用的万能模式”。

AI正从单纯的答题工具，逐步演变为支持思考过程的助手，而“推理模型”正是这一变革的象征。