Agentic AI 研究方向

研究方向

围绕大模型自主交互学习、训练框架、强化学习、知识增强、运行时系统与应用落地，构建面向科研与产业场景的 Agentic AI 技术体系。

人类学习启发的大模型自主学习

探究大模型从模型及人类反馈中进行自主交互学习的机制及方法，以实现能力持续提升。

🧭

环境探索学习

在开放任务环境、工具环境和沙盒环境中自主探索、执行行动并接收反馈，形成可学习轨迹、策略经验和奖励信号。

🔁

同行模型学习

通过模型间讨论、批判、修正、蒸馏和偏好比较，获取多样化推理轨迹、解题策略和协作学习信号。

💬

人类反馈学习

主动识别知识缺口并向专家提问，将专家反馈转化为领域知识、偏好信号和高质量训练数据。

查看主页 →

AgenticRL训练系统

研究面向多轮工具交互的统一训练系统，打通环境执行、轨迹采样、奖励反馈与策略更新。

🎯 工作流 · 环境 · 轨迹 · 优化模块解耦

🔧 步级交互建模 · 灵活上下文管理 · 多算法支持

📄 代表项目：Agent-R1

查看主页 → Agent-R1

AgenticRL优化算法

研究多轮交互中的优势估计、信用分配与奖励机制，提升长程任务的策略优化效率与稳定性。

🧮 步级 / 序列级轨迹建模

🔁 优势估计 · 信用分配 · 过程奖励

🚀 代表方法：StepPO · PSPO

查看主页 → StepPO

AgenticRL数据工程

研究面向智能体能力提升的数据基础设施，打通多源轨迹采集、质量评估、数据策划与训练供给。

📈 多源交互轨迹采集与统一表示

🧩 质量评估 · 能力增益建模 · 数据选择与调度

🗂️ 代表项目：Claw-R1

查看主页 → Claw-R1

人类反馈与环境交互驱动的大模型持续进化

面向开放复杂任务，探索人类反馈、大模型推理与环境交互协同驱动的持续学习机制，实现智能体系统能力动态演化。

🤝

人类反馈建模与主动对齐学习

如何从少量反馈中高效学习？真实科研或教育场景中，专家反馈成本很高，不可能大量标注。如何让模型主动向人提问？不是被动等人纠错，而是在不确定、冲突、缺信息时主动寻求反馈。

🧠

经验记忆交互

通过历史经验沉淀、记忆检索与交互式更新，支持经验复用、跨任务迁移和持续迭代，在不更新参数的情况下提升长期任务处理能力。

查看主页 → 科学知识交互

Retrieval-based Agentic AI

KDD Cup、Paper Search 与 DeepResearch 的系列RAG工作介绍。

🥈 KDD Cup 2024 CRAG 银牌 · Task 2&3 第二名

📚 Paper Search · 科技文献检索 · 结构化证据获取

🗞️ DeepResearch · 多步检索 · 报告生成

查看主页 → KDD Cup亚军 Paper Search DeepResearch

Coding-based Agentic AI

代码生成、沙箱执行与结构化表格数据推理的系列Coding Agent工作介绍。

🎯 Coding Generation · Data Agent · TableMind

🔧 Coding Sandbox · Tool Use · Execution Feedback

📄 TableMind · 表格理解 · 数据分析代码生成

查看主页 → TableMind TableMind++ TabClaw

大模型推理机理与智能体系统科学

围绕大模型思维链推理机理与大模型智能体机理展开研究，关注推理链路、任务分解、工具调用、记忆与反思之间的协同关系。

🧠 思维链推理机理 · 多步推理路径 · 决策过程解析

研究大模型复杂推理中的任务理解、子问题分解、证据整合、路径依赖与错误传播机制。

🧭 智能体行为动力学 · 执行轨迹 · 工具-记忆协同

研究智能体在规划、工具调用、记忆读写、环境反馈和反思修正中的动态行为演化规律。

🛡️ 可靠可控智能体 · 失败预警 · 运行时干预

研究智能体的失效模式、早期风险信号、记忆漂移、可靠性边界与可控演化机制。

查看主页 →

Agentic评测

面向复杂任务场景构建 Agent 评测体系，关注真实环境中的任务完成质量、可靠性、覆盖度与过程诊断，支撑训练、推理与应用研究的统一分析。

📏 任务质量 · 可靠性 · 覆盖度 · 过程一致性

🧪 开放环境评测 · 长程任务诊断 · 多维基准设计

📊 QRC-Eval · HLE / GAIA · 可解释性分析与误差归因

内容建设中

Agentic AI应用研究

聚焦科学智能、电力能源与推荐系统等垂直领域，探索 AI Agent 在真实场景中的知识获取、决策优化与交互式应用能力。

领域应用研究

科学智能

🔬

科学知识获取与发现

面向科学文献、实验数据和领域知识库，重点研究科研问题发现、证据追踪、知识推理与自动化研究辅助。

电力能源

⚡

电力能源调度与决策

面向电力负荷、新能源出力、设备状态和调度运行场景，重点研究预测建模、异常识别、风险评估与决策辅助。

推荐系统

🎯

个性化推荐与搜索

面向内容、电商、科研资源和个性化服务场景，重点研究偏好建模、多轮交互、排序决策与推荐结果解释。

查看主页 →

时间序列认知

星思启时序认知之智，铸星坊铸预测之器，智多星谋自主之研，观星阁观未来之势，天星台立评测之尺。

CastMind 星思：多模态推理驱动的时间序列基础模型

NeoResearch 智多星：面向时间序列预测的自主科研智能体

CastClaw 观星阁：基于自主交互的时间序列预测智能体

FutureCast 天星台：情境感知的时间序列预测评估基准

CastFactory 炼星坊：时间序列预测模型训练框架

查看主页 → CastClaw FutureCast CastFactory

科学知识认知

面向科研智能体构建从数据底座、检索技能、自主文献检索智能体到过程评测和真实用户服务的完整知识获取栈。

📚 Lewen API 数据底座 · Academic Search 检索 Skill · PaperScout 自主检索 Agent

🔎 自然语言学术问答 · 深度检索 · 文献调研 · 证据追踪与知识综合

🧩 PaperArena 过程评测 · 多步推理 · 跨论文整合 · 数据库交互能力诊断

查看主页 → Lewen API Academic Search PaperScout PaperArena 学术乐问

数据科学自主研究智能体NeoResearch

Data Science Agent 通过自主环境交互，串联文献调研、数据分析、假设生成、小模型设计、认知推理与评估修正，构建端到端自主 data mining 闭环。以 Time Series Forecasting 为典型验证场景，探索 Agent 驱动的数据科学发现范式。

1 文献调研自主检索相关工作，提炼研究空白与先验知识

2 数据分析探索性数据分析，识别分布规律、模式与关键特征

3 假设生成结合文献与数据洞察，生成可验证的研究假设

4 小模型设计针对假设自主设计轻量模型结构与实验方案

5 认知推理多步推理解读实验结果，判断假设有效性

6 评估 · 确认 · 修正量化评估结果，确认或修正假设，驱动下一轮迭代

↻ 自主迭代闭环 · 典型验证场景：Time Series Forecasting

查看主页 →

时间序列预测智能体CastClaw

面向时间序列预测研究的人机协同智能体框架。CastClaw 通过 Planner、Forecaster、Critic 三个专属智能体编排完整预测流程，并在关键节点引入人类确认，将数据分析、特征工程与经典时序模型能力封装为可扩展的运行时工具箱。

📈 多智能体协同 · 人机高效协作 · Agentic Workflow

🧰 运行时工具箱：实验执行沙盒 · 数据分析工具 · 特征分析 · 经典时序模型

🗂️ Skill 持续沉淀 · 面向真实预测工作流的研究工作台

查看主页 → GitHub

NeoResearch

面向时间序列预测小模型研发的自主研究智能体系统。NeoResearch 将研究假设、模块级 CandidateRecipe、受控实验、结果归因与研究记忆串成闭环，帮助研究员在固定数据、评估、预算和代码协议下持续发现更稳、更小、更可复现的预测模型。

🧪 Forecast Research Operating System · 假设生成 · 受控实验 · keep / discard 闭环

🧩 CandidateRecipe DSL · action registry · preprocessing / embedding / backbone / fusion / head 搜索

🧠 TaskFingerprint · Champion / Challenger · 研究记忆 · Blind Test 治理

Coming Soon

表格数据分析智能体TabClaw

面向表格数据的本地对话式 AI Agent。上传 CSV / Excel 后用自然语言描述需求，TabClaw 先展示执行计划、多表并行派遣专属 Agent、跨会话持久记忆偏好，并将每次交互蒸馏为可复用技能——无需 SQL，无需编程，对话即可完成复杂表格分析。

📋 Plan Mode · Multi-Agent 并行分析 · 技能自动蒸馏 · 持久记忆

⚡ 支持任意 OpenAI 兼容端点：OpenAI · DeepSeek · SiliconFlow · Ollama（本地）

👥 Shuo Yu · Daoyu Wang · Qingchuan Li · Xiaoyu Tao · Qingyang Mao · Yitong Zhou

查看主页 → GitHub

学术鲁班 Hub

面向科技文献挖掘的 Skill 集锦。学术鲁班 Hub 将文献检索、文献阅读与写作辅助封装为一组即插即用的原子 Skill，研究者可在 Claude Code 环境中按需调用，快速完成从选题调研到论文写作的完整科研辅助流程。

🔍 文献检索：arXiv · Semantic Scholar · PubMed 多源检索与筛选

📖 文献阅读：精读摘要 · 方法提炼 · 实验对比 · 批判性分析

✍️ 写作辅助：Related Work 生成 · 论文润色 · 投稿意见回复

查看主页 →