面向专家级商业报告合成的训练无关(training-free)调研 Agent。
通过意图澄清、动态记忆、自适应检索与多维反思,完成长程深度研究与高质量报告写作。
中国科学技术大学 · 认知智能全国重点实验室
商业分析与深度研究依赖对大量公开信息的系统梳理,但网页噪声、信息碎片化、来源时效不均与长程任务上下文遗失, 使得现有 Deep Research 类 Agent 难以稳定产出专家级报告。Mind2Report 将认知式工作流显式拆分, 使用动态记忆与多阶段反思支持长程推理与持续研究。
相比只做“搜索 + 汇总”的轻量代理,Mind2Report 更强调: 任务意图的前置澄清、研究过程中的知识沉淀、 以及终稿质量的多维校验。这使它能够在训练无关设定下,更接近专业研究员的工作方式。
Mind2Report 关注的问题不是“能否搜到网页”,而是如何从海量公开信息中产出 高质量、可靠、覆盖充分的专家级商业报告。其核心挑战包括:
用户问题往往宽泛且带有隐含分析目标,若不先澄清需求,后续检索会偏离真正的研究方向。
深度研究涉及多轮搜索、阅读、比较与写作,若缺少结构化记忆,Agent 难以维持全局一致性。
公开网页中广告、重复内容和低质量来源混杂,单纯堆叠搜索结果难以形成可信知识。
研究结果不仅要相关,还要关注覆盖度、时效性、事实一致性和观点多样性。
Mind2Report 的整体管线围绕“先理解任务,再进行研究,最后反思质量”展开, 形成一套适合专家级报告合成的认知式工作流。
通过问题澄清、领域知识聚合与章节规划,把一个宽泛问题转换为可执行的报告提纲与研究方向。
在递归研究循环中不断蒸馏信息、扩展查询、更新章节树记忆,并将证据与报告结构对齐。
围绕检索效率、信息完整性、来源新鲜度与观点多样性进行自检,修正研究盲区并提升终稿质量。
为了系统评估深度调研 Agent 的报告质量,Mind2Report 配套提出 QRC-Eval,包含 200 个真实商业研究任务, 从质量(Quality)、可靠性(Reliability)和覆盖度(Coverage)三个维度进行综合评测。
| 评测维度 | 关注点 | 意义 |
|---|---|---|
| Quality | 相关性、结构组织、表达质量 | 衡量报告是否真正回答用户问题,且逻辑清晰、专业可读 |
| Reliability | 幻觉控制、时效性、一致性 | 衡量报告中的事实是否可信,来源是否新鲜且互相一致 |
| Coverage | 研究广度与分析深度 | 衡量报告是否覆盖关键议题,而非只停留在片面摘要 |
论文报告显示,Mind2Report 在多项报告质量指标上相较强基线具备明显优势, 尤其体现在长程研究一致性、来源可靠性和 信息覆盖度方面。其核心收益来自动态记忆与多维反思,而不仅仅是更长的上下文窗口。
如果本项目对您的研究有所帮助,请考虑引用:
作者:Mingyue Cheng、Daoyu Wang、Qi Liu、Shuo Yu、Xiaoyu Tao、 Yuqian Wang、Chengzhong Chu、Yu Duan、Mingkang Long、Enhong Chen 等。
机构:中国科学技术大学 · 认知智能全国重点实验室。 同方向相关项目可参阅 Science-Star 与 Agent 推理框架总览。