Agentic AI 研究方向工作介绍

研究成果

用于介绍与展示 USTC-AGI 研究组在 Agentic AI 方向的代表性工作,涵盖训练引擎、基础算法、Agent Runtime 以及应用研究等多个方面。

Agent Training Engine

Agent 训练引擎

面向 LLM Agent 的强化学习训练工具套件。

🎯 Agent-R1 · Claw-R1 · 端到端 RL · Process Rewards
🔧 PPO / GRPO / REINFORCE++ · Runtime RL · 零代码侵入
📄 Agent-R1 项目 · Claw-R1 项目
Agentic RL Algorithms

Agentic RL算法

重点关注交互轨迹表示、优势计算与信用分配、奖励机制设计,以及长程规划与交互执行中的优化难题。

🧮 多轮交互轨迹表示 · 时序决策建模 · 长轨迹优化
🔁 优势计算 · 端到端信用分配 · 长程规划与交互执行
🚀 奖励机制设计 · 过程奖励塑形 · 克服奖励稀疏难题
Agent Architecture Design

Agent架构设计

面向复杂科学任务的 LLM Agent 推理与运行基础设施。

🎯 Science-Star · ReAct · Deep Research
🔧 HLE / GAIA · RICO · 动态记忆 · 多维反思 · 工具检索
📄 Science-Star · CrabShrimp 项目
Agent Mechanism Analysis

Agent机理分析

围绕 LLM Agent 的行为形成机制、推理决策链路与能力涌现规律展开研究,关注训练、推理、工具使用与记忆反思之间的协同关系。

🧠 行为机理 · 多步推理路径 · 决策过程解析
🔬 任务分解 · 工具调用 · 记忆与反思协同机制
📐 可解释性分析 · 诊断评测 · 能力边界研究
Agentic RAG

Agentic RAG

检索增强生成的系列工作介绍。

🥈 KDD Cup 2024 CRAG 银牌 · Task 2&3 第二名
✂️ PruningRAG · 多源知识剪枝 · CIKM 2025
🗞️ Mind2Report · Deep Research · QRC-Eval
Agentic Evaluation

Agentic评测

面向复杂任务场景构建 Agent 评测体系,关注真实环境中的任务完成质量、可靠性、覆盖度与过程诊断,支撑训练、推理与应用研究的统一分析。

📏 任务质量 · 可靠性 · 覆盖度 · 过程一致性
🧪 开放环境评测 · 长程任务诊断 · 多维基准设计
📊 QRC-Eval · HLE / GAIA · 可解释性分析与误差归因
Domain Application Research

领域应用研究

探索时间序列分析、表格挖掘、科技文献挖掘等场景的 Agentic 应用。

时间序列分析
📈
Cast-R1

聚焦时间序列预测,结合工具增强强化学习提升复杂场景建模能力。

表格数据挖掘
📊
TableMind++

面向结构化表格推理与挖掘任务,探索 Programmatic Agent 的分析范式。

科技文献挖掘
📚
PaperScout

围绕学术文献检索与多步搜索,优化过程感知的序列级策略学习。


Agentic 应用系统

面向真实任务流程的可交互 Agent 产品与原型系统。

TabClaw

面向表格数据的本地对话式 AI Agent。上传 CSV / Excel 后用自然语言描述需求,TabClaw 先展示执行计划、多表并行派遣专属 Agent、跨会话持久记忆偏好,并将每次交互蒸馏为可复用技能——无需 SQL,无需编程,对话即可完成复杂表格分析。

📋 Plan Mode · Multi-Agent 并行分析 · 技能自动蒸馏 · 持久记忆
支持任意 OpenAI 兼容端点:OpenAI · DeepSeek · SiliconFlow · Ollama(本地)
👥 Shuo Yu  ·  Daoyu Wang  ·  Qingchuan Li  ·  Xiaoyu Tao  ·  Qingyang Mao  ·  Yitong Zhou

CastClaw

面向时间序列预测研究的人机协同智能体框架。CastClaw 通过 Planner、Forecaster、Critic 三个专属智能体编排完整预测流程,并在关键节点引入人类确认,将数据分析、特征工程与经典时序模型能力封装为可扩展的运行时工具箱。

📈 多智能体协同 · 人机高效协作 · Agentic Workflow
🧰 运行时工具箱:实验执行沙盒 · 数据分析工具 · 特征分析 · 经典时序模型
🗂️ Skill 持续沉淀 · 面向真实预测工作流的研究工作台

学术鲁班 Hub

面向科技文献挖掘的 Skill 集锦。学术鲁班 Hub 将文献检索、文献阅读与写作辅助封装为一组即插即用的原子 Skill,研究者可在 Claude Code 环境中按需调用,快速完成从选题调研到论文写作的完整科研辅助流程。

🔍 文献检索:arXiv · Semantic Scholar · PubMed 多源检索与筛选
📖 文献阅读:精读摘要 · 方法提炼 · 实验对比 · 批判性分析
✍️ 写作辅助:Related Work 生成 · 论文润色 · 投稿意见回复

团队成员

指导教师

刘淇
程明月
李鑫
陈恩红