研究大模型思维链推理机理与大模型智能体机理,解析从问题理解、任务分解、推理链路、工具调用到记忆与反思的行为形成过程。
中国科学技术大学 · 认知智能全国重点实验室
随着大模型从问答生成走向复杂任务求解,研究重点不再只是最终答案是否正确,还需要理解中间推理链路如何组织、任务如何分解、工具调用如何影响后续决策、记忆与反思如何改变长期行为。 本方向面向大模型思维链推理机理与大模型智能体机理,系统分析模型在多步推理、规划执行、环境反馈和能力边界上的行为规律。
目标是在可观测的轨迹、过程信号和评测结果之间建立联系:既解释链式推理中的中间步骤、验证与纠错机制,也解释 Agent 在任务分解、工具调用、记忆更新和反思修正中的行为形成机制。
思维链推理机理研究大模型如何把输入问题转化为中间状态、推理步骤和候选结论,以及这些步骤如何影响最终答案。 重点关注链式推理是否真正承载问题求解过程、哪些步骤贡献了关键约束、错误如何沿推理链路传播,以及验证和自我修正机制何时有效。
分析模型如何识别任务条件、约束关系和目标状态,解释问题理解阶段对后续推理路径的影响。
研究中间步骤的生成顺序、依赖关系和信息传递,刻画多步推理路径的稳定性与可迁移性。
分析模型如何检查中间结论、发现冲突并修正答案,理解自洽采样、反思和过程反馈的有效条件。
大模型智能体机理研究模型从“生成回答”走向“规划、行动、观察、修正”的过程机制。 该方向关注 Agent 如何进行任务分解、选择工具、解释环境反馈、维护记忆并通过反思调整下一步行动,从而形成长程任务中的稳定行为。
分析复杂任务如何被拆解为可执行子目标,以及规划结构如何影响后续搜索、调用和结果整合。
研究工具选择、参数构造、执行结果读取和失败恢复,解释外部工具如何改变 Agent 的决策链路。
刻画历史经验、检索记忆和反思摘要如何进入当前上下文,影响跨轮次任务求解与长期行为改进。
机理分析需要把可观测轨迹转化为可解释证据。该方向通过过程数据采集、对比实验、错误归因和诊断评测,分析模型在推理与智能体行为中的稳定性、可控性和失效模式。
记录思维链、工具调用、环境观察、记忆检索和反思修正等过程信号,形成可诊断的行为轨迹。
通过提示、工具、记忆和反馈信号的对照实验,定位影响推理质量和 Agent 行为的关键因素。
不仅评价最终答案,还评价中间步骤、行动选择、恢复能力和长期一致性,刻画模型能力边界。
将诊断结果反馈到提示策略、训练数据、奖励设计和 Agent 系统架构中,支撑可解释的持续改进。