个人简介
博士后研究员,普渡 CS Ph.D.,AI Agent 研发工程师,7+ 年 AI 研究与工程经验,成果发表于 NeurIPS、ICML、CVPR、SoCG 等顶级会议;上海市白玉兰人才计划青年人才,担任 TAG-DS Workshop Area Chair,ICML、ICLR、NeurIPS、SoCG 等会议审稿人。Synapse 创业公司技术合伙人,负责 Agentic 开发基础设施、多智能体协作编排、Data Pipeline、RAG/Agentic Search、Evaluation Benchmark 和业务流程集成等模块。能够把投研、咨询、医疗等复杂业务场景抽象为可验证的 Agent workflow,建设从开发框架、工具调用、安全边界、证据归因到客户化 eval pack 和上线平台的完整工程链路。
技术技能
Agentic AI
Agent Workflow
工具调用
业务流程建模
Prompt 编排
MCP / Skill
多智能体协作
状态管理
可观测性
迭代优化
编程语言
Python
TypeScript
Node.js
React
JavaScript
SQL
Java
C++
PyTorch
TensorFlow
Spark
CUDA
LLM 应用
LLM/VLM
RAG
Agentic Search
证据归因
Eval Harness
模型评测
样本构建
效果分析
Prompt Engineering
基础设施
Vercel
Supabase
PostgreSQL
API / SDK
数据库
全栈开发
CI/CD
工业经历、实习与开源贡献
博士后期间并行参与 · Agent 工具调用基础设施、Data Gateway、医疗 AI 评测平台
- SDK: 参与开发受监管行业 Agent tool layer,将 search、crawl、privacy guardrail 等外部能力封装为统一 SDK/API;实现 provider routing、统一响应结构、成本/延迟/质量策略、provider allowlist、失败切换、调用原因记录和审计日志,降低多供应商工具接入与线上排障成本
- Data Gateway: 构建面向高风险 Agent workflow 的数据边界、评测与治理框架,将客户场景、失败案例、权限边界和合规要求沉淀为可重复运行的 eval pack;设计 10,000-case healthcare-agent privacy benchmark,覆盖信息披露、外部转交、共享控制、证据包等业务风险,并输出 coverage delta、错误分布和问题定位报告
- Clinic Arena(已上线: clinicalarena.ai): 参与开发并上线医疗 AI 评测平台,支持临床场景下的盲测 head-to-head LLM 比较、偏好数据收集、安全标注、排行榜和评测结果导出;实现多 provider LLM gateway、OpenAI-compatible streaming、Bradley-Terry 排名、bootstrap confidence interval、uncertainty-weighted pairing、vote-quality / safety scoring 与 DPO/scalar 数据导出
- 作为 OpenClaw 早期 Contributor(前 1000 位),累计提交和维护 20+ 个 Pull Request,推动多项 Agent Gateway、A2A 会话协议、消息路由、Memory 优化、模型兼容与 tool calling 相关问题的修复与改进;设计并实现多种可复用 Agent Skill 与自动化工作流,覆盖科研自动化、任务拆解、Web/社交信息检索、跨来源内容汇总和长流程任务恢复;围绕 Session/Thread 状态管理、Memory 管理、上下文 handoff、评测闭环与多 Agent 协作,优化复杂 Agent Harness 系统的稳定性、可恢复性和执行效率
大数据与分析 | 加州红木城
- 负责基于 Spark 搭建玩家行为数据的端到端 ML 流水线,覆盖数据清洗、特征构建、训练样本生成、建模支持和参与度预测分析,支撑业务侧对大规模用户行为的持续评估
- 将业务问题拆解为可验证的数据与模型任务,围绕样本质量、特征覆盖、异常分布和预测效果做问题定位,形成从数据准备、实验分析到业务解释的闭环,契合 AI 应用评测体系建设中的样本整理、效果分析与迭代优化需求
- 设计并推动特征工程与数据压缩方案落地,将数据视图体量降低 30–40%,提升下游分析效率与建模资源利用率
AWS 基础设施组 | 西雅图
- 参与开发并部署实时数据管理系统,处理大规模网络消息流,承担后端基础设施、服务接口和数据流转模块实现,支持内部系统稳定运行与消息处理效率提升
- 围绕高吞吐消息处理场景进行问题排查与性能优化,关注数据结构、并发处理、异常恢复和运行稳定性,为后续构建可靠 Agent workflow 服务接口与基础组件打下工程基础
- 独立负责 Web 应用主要模块开发,覆盖数据库建模、后端业务 API、NLP 功能实现与前端 UI/UX,具备从需求理解、模块设计、接口实现到交付验证的完整全栈推进经验
- 面向业务文本处理场景实现 NLP 功能模块,将非结构化文本转化为可查询、可处理的数据对象,与当前 LLM 应用中的检索增强、信息抽取和业务流程集成经验形成连续性
- 面向开发者与企业用户排查并解决复杂 SQL Server 问题,围绕日志、查询计划、性能瓶颈和配置差异进行根因定位,形成数据库系统分析、问题排查与查询优化的系统化实践能力
- 在企业级支持场景中训练面向真实用户问题的结构化诊断能力:复现问题、定位边界条件、提出可执行修复路径,并将经验沉淀为可复用的排障知识
教育与科研经历
导师: Prof. Jie Gao
- 围绕 Agentic RL / 多步决策问题开展原型实验与评测探索,关注反馈信号设计、行为优化与实验分析,积累相关研发经验(相关工作:[ICML 2024])
- 主导开发 TopInG 可解释图学习框架,负责方法设计、实验推进、结果分析与论文产出,在分子性质预测任务上实现精度和可解释性最高 20% 提升([ICML 2025])
- 参与建设 DL3DV-10K 大规模 3D 视觉基准,支持数据整理、基准构建与研究验证,项目覆盖 10K+ 真实场景,GitHub 获 550+ Stars,形成可被后续研究持续复用的公共资源([CVPR 2024])
- 开展非欧几何与双曲空间表示学习研究,围绕 Neuc-MDS、超越欧氏空间的 Johnson-Lindenstrauss 扩展,以及 Hyperbolic Space LSH 推进具有理论保证的表示学习与近邻检索方法([NeurIPS 2024], [NeurIPS 2025], [SoCG 2026])
导师: Prof. Tamal K. Dey
- 主导推进 GRIL 拓扑向量化框架研究,从理论建模、算法设计到实验验证完整闭环落地,证明其具备更强表达能力;并进一步延展到 D-GRIL 端到端拓扑学习方向,推动多参数持续性表示直接进入可微学习流程,并探索将拓扑与几何方法应用到 AI4Science 场景,增强理论工具在药物发现、材料设计等实际任务中的落地解释力([PMLR 2023], [SoCG 2026])
- 开发广义持续性算法,提升多参数拓扑分析任务的计算效率,为大规模科学/几何数据处理提供可复用的算法基础与实现路径([JACT 2022])
教育背景
计算机科学博士 · 普渡大学 (Purdue University)
2023
论文: Decomposition and Stability of Multiparameter Persistence Modules · 导师: Prof. Tamal K. Dey
计算机科学硕士 · 理海大学 (Lehigh University)
2016
论文: Machine Learning Techniques for Medical Image Analysis · 方向: 计算机视觉、深度学习医疗影像
代表论文
SoCG 2026 S. Mukherjee, S. N. Samaga, C. Xin, S. Oudot, T. K. Dey. "D-GRIL: End-to-End Topological Learning with 2-parameter Persistence"
SoCG 2026 C. Deng, J. Gao, K. Lu, F. Luo, C. Xin. "Locality Sensitive Hashing in Hyperbolic Space"
ICML 2025 C. Xin et al. "TopInG: Topologically Interpretable Learning via Persistent Rationale Filtration"
NeurIPS 2025 C. Deng, J. Gao, K. Lu, F. Luo, C. Xin. "Johnson-Lindenstrauss Lemma Beyond Euclidean Geometry"
NeurIPS 2024 C. Deng, J. Gao, K. Lu, F. Luo, H. Sun, C. Xin. "Neuc-MDS: Non-Euclidean MDS Through Bilinear Forms"
CVPR 2024 L. Ling, ..., C. Xin, et al. "DL3DV-10K: A Large-Scale Scene Dataset for Deep Learning-Based 3D Vision"
ICML 2024 S. Haddadan, C. Xin, J. Gao. "Optimally Improving Cooperative Learning in a Social Setting"
荣誉与领导力
上海市白玉兰人才计划青年人才(2025)
微软高校编程大赛冠军(2017 @ 俄亥俄州立大学、2015 @ 理海大学)
研究生课程讲师: 算法设计与分析(45 名学生,2025)
Area Chair: TAG-DS Workshop(2026)
审稿人: ICML、ICLR、NeurIPS、SoCG
v.2026-05-22