Agent 应用 — Cast-R1 · TableMind++ · PaperScout

研究方向： 本方向将 Agentic RL 与工具增强方法应用于具体场景。 Cast-R1 将 RL 引入时间序列预测的顺序决策； TableMind++ 构建不确定性感知的表格推理 Agent； PaperScout 实现面向学术文献检索的自主 Agent，并提出过程感知的序列级策略优化方法； AnomaMind 将时间序列异常检测重构为工具增强的顺序决策过程，融合自反思与强化学习。

四项研究概览

📈

Cast-R1

时间序列预测中的工具增强顺序决策。arXiv 2602.13802

📊

TableMind++

不确定性感知的 Programmatic Agent 表格推理。arXiv 2603.07528

📚

PaperScout

学术论文检索自主 Agent，提出 PS-SPO 策略优化。arXiv 2601.10029

🔍

AnomaMind

时间序列异常检测的 Agentic 框架，工具增强推理与自反思。arXiv 2602.13807

Cast-R1

Cast-R1 · arXiv 2602.13802

Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting

Xiaoyu Tao · Mingyue Cheng · Chuang Jiang · Tian Gao · Huanjian Zhang · Yaguo Liu
中国科学技术大学 · 认知智能全国重点实验室

时间序列预测顺序决策 Agentic Systems 强化学习工具增强

时间序列预测是数据分析中的核心任务，但传统方法难以处理复杂的非平稳序列和多变量依赖关系。Cast-R1 将 LLM Agent 的顺序决策能力引入时间序列预测领域，通过强化学习训练 Agent 学会选择并调用合适的预测工具，以多步规划替代单次前向传播。

Cast-R1 的核心贡献在于将时间序列预测建模为一个工具增强的顺序决策问题，并基于 Agent-R1 框架设计了适配时序预测场景的奖励函数与过程奖励机制，实现了端到端的 RL 训练。实验结果验证了 Agentic 方法在时序预测任务上相对传统基线的显著提升。

arXiv 2602.13802 ← 返回主页

引用

@misc{tao2026castr1, title={Cast-R1: Learning Tool-Augmented Sequential Decision Policies for Time Series Forecasting}, author={Tao, Xiaoyu and Cheng, Mingyue and Jiang, Chuang and Gao, Tian and Zhang, Huanjian and Liu, Yaguo}, year={2026}, eprint={2602.13802}, archivePrefix={arXiv}, primaryClass={cs.LG} }

TableMind++

TableMind++ · arXiv 2603.07528

TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning

Mingyue Cheng · Shuo Yu · Chuang Jiang · Xiaoyu Tao · Qingyang Mao · Jie Ouyang · Qi Liu · Enhong Chen
中国科学技术大学 · 认知智能全国重点实验室

表格推理 Programmatic Agent 不确定性感知工具增强 LLMs

表格数据是现实世界中最常见的结构化信息载体，但对 LLM 而言，直接处理大型表格面临上下文长度限制、数值推理错误、列理解偏差等多重挑战。TableMind++ 提出了一个不确定性感知的 Programmatic Agent 框架，通过将表格推理分解为可由程序工具（SQL、Python pandas 等）执行的操作序列，大幅提升推理可靠性。

TableMind++ 的核心创新在于引入不确定性感知机制：Agent 在执行每步操作时估计结果的置信度，当置信度低于阈值时触发验证子程序或备选策略，有效降低了中间步骤错误的累积效应。在多个表格问答基准上，TableMind++ 显著优于直接提示和无不确定性感知的基线方法。

arXiv 2603.07528 ← 返回主页

引用

@misc{cheng2026tablemind, title={TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning}, author={Cheng, Mingyue and Yu, Shuo and Jiang, Chuang and Tao, Xiaoyu and Mao, Qingyang and Ouyang, Jie and Liu, Qi and Chen, Enhong}, year={2026}, eprint={2603.07528}, archivePrefix={arXiv}, primaryClass={cs.AI} }

PaperScout

PaperScout · arXiv 2601.10029

PaperScout: An Autonomous Agent for Academic Paper Search with Process-Aware Sequence-Level Policy Optimization

Tingyue Pan · Jie Ouyang · Mingyue Cheng · Qingchuan Li · Zirui Liu · Mingfan Pan · Shuo Yu · Qi Liu
中国科学技术大学 · 认知智能全国重点实验室

学术文献检索自主 Agent 序列级策略优化过程感知 cs.AI

学术文献检索是科研工作中的高频需求，但传统检索系统依赖关键词匹配，难以理解研究者的深层意图，也无法进行多步迭代检索。PaperScout 构建了一个面向学术论文搜索的自主 Agent，能够理解自然语言描述的检索需求，通过多轮查询精炼逐步锁定相关文献。

PaperScout 的核心技术贡献是提出了过程感知序列级策略优化（PS-SPO）：不同于仅以最终检索结果为奖励的 RL 方法，PS-SPO 在搜索过程的每个中间步骤（查询重写、结果过滤、相关性判断）都给予过程奖励，指导 Agent 学习更高效的多步检索策略。实验表明，PS-SPO 在检索覆盖率和准确率上均优于传统方法。

arXiv 2601.10029 ← 返回主页

引用

PaperScout

@misc{pan2026paperscout, title={PaperScout: An Autonomous Agent for Academic Paper Search with Process-Aware Sequence-Level Policy Optimization}, author={Pan, Tingyue and Ouyang, Jie and Cheng, Mingyue and Li, Qingchuan and Liu, Zirui and Pan, Mingfan and Yu, Shuo and Liu, Qi}, year={2026}, eprint={2601.10029}, archivePrefix={arXiv}, primaryClass={cs.AI} }

AnomaMind

AnomaMind · arXiv 2602.13807

AnomaMind: Agentic Time Series Anomaly Detection with Tool-Augmented Reasoning

Xiaoyu Tao · Yuchong Wu · Mingyue Cheng · Ze Guo · Tian Gao
中国科学技术大学 · 认知智能全国重点实验室

时间序列异常检测工具增强推理顺序决策自反思机制强化学习

时间序列异常检测在工业监控、金融风控等场景中至关重要，但传统判别式方法依赖静态特征提取，难以适应上下文依赖的多样异常模式。AnomaMind 将异常检测重构为顺序决策过程：Agent 通过多轮工具调用对可疑区间进行由粗到细的定位，并结合动态特征准备与多维证据推理做出诊断。

AnomaMind 的核心创新包括：粗到细定位策略精确识别异常区间；多轮工具交互实现自适应特征准备与动态分析；自反思机制允许 Agent 迭代修正检测决策；以及结合通用模型与强化学习的混合推理范式，实现任务专属的策略优化。

arXiv 2602.13807 ← 返回主页

引用

AnomaMind

@misc{tao2026anomamind, title={AnomaMind: Agentic Time Series Anomaly Detection with Tool-Augmented Reasoning}, author={Tao, Xiaoyu and Wu, Yuchong and Cheng, Mingyue and Guo, Ze and Gao, Tian}, year={2026}, eprint={2602.13807}, archivePrefix={arXiv}, primaryClass={cs.LG} }