将 Agentic 方法落地于实际场景的四项研究:
时间序列预测 · 表格推理 · 学术文献检索 · 时间序列异常检测
中国科学技术大学 · 认知智能全国重点实验室
时间序列预测中的工具增强顺序决策。arXiv 2602.13802
不确定性感知的 Programmatic Agent 表格推理。arXiv 2603.07528
学术论文检索自主 Agent,提出 PS-SPO 策略优化。arXiv 2601.10029
时间序列异常检测的 Agentic 框架,工具增强推理与自反思。arXiv 2602.13807
时间序列预测是数据分析中的核心任务,但传统方法难以处理复杂的非平稳序列和多变量依赖关系。Cast-R1 将 LLM Agent 的顺序决策能力引入时间序列预测领域,通过强化学习训练 Agent 学会选择并调用合适的预测工具,以多步规划替代单次前向传播。
Cast-R1 的核心贡献在于将时间序列预测建模为一个工具增强的顺序决策问题,并基于 Agent-R1 框架设计了适配时序预测场景的奖励函数与过程奖励机制,实现了端到端的 RL 训练。实验结果验证了 Agentic 方法在时序预测任务上相对传统基线的显著提升。
表格数据是现实世界中最常见的结构化信息载体,但对 LLM 而言,直接处理大型表格面临上下文长度限制、数值推理错误、列理解偏差等多重挑战。TableMind++ 提出了一个不确定性感知的 Programmatic Agent 框架,通过将表格推理分解为可由程序工具(SQL、Python pandas 等)执行的操作序列,大幅提升推理可靠性。
TableMind++ 的核心创新在于引入不确定性感知机制:Agent 在执行每步操作时估计结果的置信度,当置信度低于阈值时触发验证子程序或备选策略,有效降低了中间步骤错误的累积效应。在多个表格问答基准上,TableMind++ 显著优于直接提示和无不确定性感知的基线方法。
学术文献检索是科研工作中的高频需求,但传统检索系统依赖关键词匹配,难以理解研究者的深层意图,也无法进行多步迭代检索。PaperScout 构建了一个面向学术论文搜索的自主 Agent,能够理解自然语言描述的检索需求,通过多轮查询精炼逐步锁定相关文献。
PaperScout 的核心技术贡献是提出了过程感知序列级策略优化(PS-SPO):不同于仅以最终检索结果为奖励的 RL 方法,PS-SPO 在搜索过程的每个中间步骤(查询重写、结果过滤、相关性判断)都给予过程奖励,指导 Agent 学习更高效的多步检索策略。实验表明,PS-SPO 在检索覆盖率和准确率上均优于传统方法。
时间序列异常检测在工业监控、金融风控等场景中至关重要,但传统判别式方法依赖静态特征提取,难以适应上下文依赖的多样异常模式。AnomaMind 将异常检测重构为顺序决策过程:Agent 通过多轮工具调用对可疑区间进行由粗到细的定位,并结合动态特征准备与多维证据推理做出诊断。
AnomaMind 的核心创新包括:粗到细定位策略精确识别异常区间;多轮工具交互实现自适应特征准备与动态分析;自反思机制允许 Agent 迭代修正检测决策;以及结合通用模型与强化学习的混合推理范式,实现任务专属的策略优化。