AI Agent Product Lead

把 Agent 做成产品,
不是把 AI 接进页面。

我是张树平,AI Agent 产品负责人。我的核心能力是把业务 SOP、工具调用、上下文、评测、人审边界和商业结果组织成可上线的 Agentic Product System。

4 年 AI 产品与创业经历,覆盖 Agent 工作流、Production RAG、智能搜索和创作者决策系统。

Agentic Product OSTool BoundariesContext EngineeringEvalsHuman-in-the-loopCommercialization
4+
年 AI 产品经验
2w+
开源部署用户
6.3K
GitHub Stars
40+
Agent 场景 SOP
10+
AI 相关知识产权
春晖杯
创新创业大赛优胜奖
Selected Work

我做过哪些 AI 产品工作

不是项目流水账,而是把几个关键工作摊开看:问题是什么,我怎么设计 Agent / Workflow,最后用什么指标判断结果。

Creator Decision Intelligence System

爆款预言 Agent

面向短视频创作者的内容决策系统。重点不是生成更多文案,而是在发布前帮助创作者判断什么值得做、为什么值得做、依据是什么、如何验证。

当前核心项目:最能体现内容决策、商业化转化和 Agent 产品边界。
可见产物
趋势信号、历史对标、评分模型和结果页转化路径
我的角色
AI 产品负责人 / 评分系统 / 结果页体验 / 决策系统设计
Creator IntelligenceTrend SignalBenchmark ValidationScoring SystemDecision Support
01

趋势信号、历史对标、评分模型和结果页转化路径

业务阻塞

创作者缺的不是生成工具,而是在有限时间里判断现在最值得投入的内容方向。

Agent / Workflow 设计

把趋势信号、历史爆款对标、评分系统和结果页行动建议组合成决策支持系统。

工具与上下文

多平台信号采集、去噪、Benchmark Validation、评分权重和结果页依据解释。

评测指标

信号准确率、推荐行动转化、结果验证率,以及创作者是否理解不确定性。

结果

把“凭感觉选题”升级为“有依据的投入判断”,降低试错成本。

产品判断

爆款预测的价值不在“承诺一定会火”,而在给创作者一个可验证的行动依据。

AI Agent 短视频生产系统

创瓜 Chuanggua

从对标爆款视频到自动化成片的一站式 Agent 工作流,把视频生产拆成可执行、可复核、可评测的多 Agent 节点。

可见产物
爆款分析 Agent、脚本 Agent、素材匹配 Agent、剪辑 Agent 和分发节点
我的角色
项目负责人 / AI 产品经理
Multi-Agent WorkflowVideo UnderstandingRAG Asset MatchingAutomated Editing
10-15min
单条视频生产周期
12x
生产效率提升
~95%
自动化率
~80%
人力成本降低
生产级 RAG / AI 记忆系统

Hybrid RAG 数字人知识库

面向 C 端用户和 AI 数字人的长期记忆系统,用 Hybrid RAG、分区隔离和评测体系提升复杂查询的召回责任。

可见产物
多租户知识库、自动化 ETL、Hybrid Retrieval、长期记忆和召回评测
我的角色
AI 产品负责人
Hybrid RAGMilvusBGE EmbeddingMemoryRetrieval Eval
+30%
复杂查询召回提升
90%+
Top-5 召回准确率
~200ms
百万级向量检索
开源大模型应用平台

Wenda 闻达大模型调用平台

面向个人和中小企业的开源大模型调用与知识库平台,核心价值是降低从看到、部署到真正使用的每一步摩擦。

可见产物
多模型适配、知识库工具、私有化部署和开发者体验
我的角色
联合创始人 / 产品规划
Open SourceLLM PlatformPrivate DeploymentDeveloper Experience
6.3K
GitHub Stars
2w+
累计部署用户
Operating System

Agentic Product OS

我不是把 AI 当功能插件,而是把它设计成一套可执行、可观测、可评测、可复核的产品系统。

01

业务 SOP 化

把真实业务阻塞拆成输入、判断、执行、复核和异常处理。

产物:任务链 / 边界表
02

工具与权限边界

定义 Agent 能看什么、调什么、写什么、何时停下。

产物:工具协议 / 降级路径
03

上下文与记忆

组织用户画像、知识库、状态、历史结果和多 Agent 共享上下文。

产物:Context schema / Memory policy
04

评测与可观测

让准确率、召回、延迟、成本、失败模式和转化都可追踪。

产物:Eval set / Trace / Dashboard
05

人审与商业闭环

把高风险节点交给人,把可验证结果交给商业化指标。

产物:Review gate / Monetization signal

这就是我和“会用 AI 做页面”的区别

普通 AI 使用者交付的是一次性输出;Agentic Product Builder 交付的是能被运行、复核、评测和持续迭代的系统。

Method

从想法到上线产物

一个 AI 产品能否成立,取决于它能不能进入真实工作流,并对结果负责。

01

识别真实业务阻塞

不是问能不能用 AI,而是业务到底卡在哪里。

02

判断系统形态

Agent、Workflow、RAG、规则和人工流程各有边界。

03

做出可运行产物

用原型、结果页、任务链或评测集把判断跑出来,而不是只写 PRD。

04

用评测决定迭代

把体验、准确率、成本、延迟和转化变成迭代依据。

Capability Stack

能力结构

不是技能清单,而是把 AI 产品推到上线和结果验证所需的能力系统。

Agentic 工作流设计

将业务 SOP 拆解为可执行、可观测、可评估的 AI 工作流,明确 Agent、Workflow、规则和人工审核的边界。

生产级 RAG 与智能搜索

设计 Hybrid RAG、多租户知识库、非结构化数据 ETL、召回评测、重排和长期记忆系统。

AI 产品评测体系

关注 Agent / RAG 产品的准确率、召回率、稳定性、延迟、成本、失败模式和用户可感知结果。

工具调用与上下文工程

设计 Agent 可理解、可调用、可复盘的工具接口、上下文结构和工作流边界。

内容创作者智能产品

从 AI 写作走向内容决策,帮助创作者判断现在该做什么、为什么值得做、如何验证。

0 到 1 AI 产品商业化

从需求调研到付费转化,推动 AI 项目从 demo 走向可商业化的产品。

2026 Theses

AI 产品判断

我关注的不是“用了 AI”,而是一个系统是否能可靠执行、被观测、被评测,并对业务结果负责。

01Thesis

Agentic Engineering 决定 AI 产品上限

Vibe Coding 能提高原型速度,但真正的能力是把模型、工具、状态、评测和人审组织成稳定系统。

应用于: 个人主页 / 爆款预言 Agent / Agentic Product OS观点资产
02Building

AI 产品要进入真实生产任务

我的判断是:AI 产品会从信息展示、辅助建议,进入真实生产任务。能不能成立,不看概念多先进,而看它是否能在真实环境里接任务、调用工具、协同流程、交付可检查结果,并在关键节点允许人接管。

应用于: 爆款预言 Agent / 创瓜 / Agentic Product OS观点资产
03Signal

Evals 是产品能力,不是测试附录

上线级 AI 产品必须能解释什么算成功、什么算失败、失败后怎么降级。

应用于: Hybrid RAG / 创瓜观点资产
04Thesis

创作者不缺生成工具,缺内容决策系统

中小创作者真正缺的是在有限时间和成本下判断现在最值得做什么、为什么值得做、如何验证。

应用于: 爆款预言 Agent / Creator Intelligence观点资产
05Thesis

RAG 的难点是召回责任

生产级 RAG 必须说明为什么召回、哪些内容可信、漏掉了什么,以及不知道时如何表达。

应用于: Hybrid RAG 数字人知识库观点资产
06Field Note

AI PM 必须交付可运行产物

2026 年的 AI 产品经理不能只交付 PRD,而要能用工具做出可点击、可测试、可评测、可讨论商业结果的产品产物。

应用于: Vibe Coding MVP / AI 产品原型观点资产
判断标准

我的 AI 产品判断标准

每个 AI 产品想法,我都会用这 5 个标准检验。

1

是否解决真实业务阻塞,而不是制造新功能?

2

是否能从辅助工具升级为生产工具,接住真实任务?

3

是否有工具、权限、上下文和人工确认边界?

4

是否有评测集、trace 和失败降级方案?

5

是否最终产生用户可感知结果和商业价值?

关于我

我是张树平,AI Agent 产品负责人。过去几年,我持续参与 AI Agent、RAG 知识系统、智能搜索、内容创作者工具和企业 AI 应用的 0 到 1 建设,也创办过 AI 初创公司并带领团队做过客户交付。

我关注的不是“AI 概念本身”,而是大模型能力如何进入真实业务流程,如何被用户感知,如何被评测,如何控制成本、延迟和风险,最终如何形成可持续的产品价值。

经历

经历

2025 - 至今

AI 产品经理

安徽峰极未来科技有限公司

负责 C 端 AI 产品、Agent/workflows 应用、多租户 RAG 知识库、移动端与小程序产品流程。

2025 - 至今

AI Agent 短视频生产系统 - 项目负责人

创瓜 Chuanggua

从 0 到 1 设计多 Agent 视频生产闭环,覆盖爆款视频分析、脚本生成、素材匹配、自动剪辑与分发。

2022 - 2025

AI 创业主理人

安徽云洽人工智能有限公司

负责 AI 产品路线、团队协作、客户交付与产品生命周期管理,推动大模型、Agent、私有化 AI 项目落地。

2023 - 2024

联合创始人 / 产品规划

Wenda 闻达大模型调用平台

参与开源大模型平台产品规划,支持多模型适配、知识向量化和私有化 AI 应用。

2018 - 2022

国际贸易本科

韩国汉拿大学

两次获得全额奖学金,参与中韩交流与 VR 展示活动。

合作机会

适合一起讨论 AI Agent 产品、企业 AI 落地、Agent-ready 软件改造、RAG / Context Engineering,以及从 demo 到可上线系统的产品化工作。

我关注的趋势判断
01AI 原生产品不是把 AI 加进旧流程,而是重写流程。最重要的是定义环境:Agent 能看到什么、调用什么、改变什么、何时停下、如何交给人,以及结果如何被检查。
02软件需要为 Agent 重新设计。过去的软件默认给人点击、阅读、复制、跳转和记忆上下文;Agent 需要长期在线、可调用接口、可追踪状态、可读写上下文、可执行动作和可验证结果。未来不是加一个“AI 助手按钮”,而是底层架构要 Agent-ready。
03Prompt 不再是核心资产,Context Engineering 才是。真正影响结果的是任务状态、工具边界、历史记录、用户意图、权限、知识结构和评测反馈如何被组织。
04RAG 不应该把所有内容预先塞进上下文。更好的形态是:用可追溯记录代替模型记忆,用关系图谱组织世界状态和因果关系,用向量检索辅助模糊召回,再让 Agent 按需查证。
05Token 不应该成为唯一度量。AI 产品真正要定义的是效果标准:任务是否完成、结果是否可验证、成本是否可控、失败是否可恢复。未来更有价值的计费方式会从“消耗多少”转向“交付了什么效果”。
06AI 产品会从“模型能力展示”走向“组织能力重构”。真正有价值的不是模型单点更强,而是把人、Agent、工具、数据、权限和复盘机制重新编排,让一个团队的知识、判断和执行速度整体上升。
zhangshuping05@gmail.com合肥 / 新加坡 / 海外 / 远程协作
张树平微信二维码
微信沟通

扫码添加微信,请备注来意,例如:AI 产品合作 / Agent 项目 / 招聘沟通。

也可以直接发送邮件到 zhangshuping05@gmail.com