
让你的 AI Agent 直接出图、出视频、出配音 —— ZOOOP skill 上手指南
写着一篇文档,突然觉得这里缺张配图。
以前的做法是:打开浏览器、找一个 AI 生图站、登录、复制 prompt、调参、等图、下载、拖回项目。来回切八九下,中间还可能被推送、被弹窗、被 Discord 消息打断。
ZOOOP skill 就是把这一整套流程压回 AI Agent 对话框里。你在 Claude Code、Cursor、Codex、Gemini CLI 这类 AI Agent 里说一句"给这段加张配图,横版、暗底、有一只小机器人飘浮",Agent 自己去调 ZOOOP,几十秒后图就贴回到对话里。
为什么要把 AI 生成交给 AI Agent
AI Agent 已经接管了大半个写代码、写文案的过程。但凡需要一张图、一段视频、一段配音,创作者还是得回到浏览器。这个上下文切换,是当前 AI 创作工作流里最碎的环节之一。
ZOOOP skill 的思路其实很简单:既然 AI Agent 已经在你旁边,就让它顺手把生成这件事也办了。你不用学新工具、不用切窗口,告诉 Agent 你想要什么,它会用你 ZOOOP 账户里的额度去生。
ZOOOP skill 能让 AI Agent 做什么
装上之后,你的 AI Agent 就能调起 ZOOOP 上几乎所有的生成能力。常见的几类:
- AI 图像生成:一句话出图、参考图改风格、按角色出多张
- AI 图像编辑:局部擦掉、换物体、补背景
- AI 视频生成:文本生成视频,接入了 Veo 3.1、Kling V3、Seedance 2、Nanobanana……
- 首尾帧生成视频:给一张静态图加动作
- 口型对齐:让人物根据音频开口说话
- AI 配音 与声音克隆:文本转语音,或克隆指定嗓音
- AI 音乐 与音效:背景配乐和环境音
也就是说,日常做内容里所有用得到 AI 生成的环节,基本都能让 AI Agent 一句话搞定。
装一次,主流 AI Agent 都能用
ZOOOP skill 不绑定单一 Agent 平台。Claude Code、Codex、Cursor、Gemini CLI,以及其他兼容 skill / MCP 协议的客户端,装一次就能跨工具复用。
步骤大致是这样:
-
去 zooop.ai 用户中心创建一个 API key,绑定到某个项目,顺手设个每日额度上限。
-
在自己电脑的终端里,把 key 写进环境变量
ZOOOP_API_KEY(不要贴到 Agent 对话框里)。 -
装 skill。最简单的方式是直接把 GitHub 链接 github.com/zooopai/skill-zooop 丢给你的 AI Agent,让它自己看 README 装上 —— 现在的 Agent 普遍认得这种"看仓库自己装"的指令,基本不用你操心命令格式。
-
想自己手动跑命令也行。跨 Agent 的统一方式:
npx skills add zooopai/skill-zooopClaude Code、Cursor、Codex、Gemini CLI、GitHub Copilot、Windsurf 等几十个客户端都认这条。想只装到特定 Agent,加
-a参数:npx skills add zooopai/skill-zooop -a claude-code -a cursorClaude Code 用户也可以走原生命令,效果一样:
claude install github:zooopai/skill-zooop -
重启 Agent,让它读到环境变量。
整个过程不到五分钟,而且 AI Agent 不需要自己去翻 API 文档 —— skill 里已经把"什么场景用哪个生成类型"、"参数怎么填"、"出错怎么办"全写好了,Agent 一边读一边就会用。
第一次用:让 AI Agent 出一张图
最简单的入门方式,就是直接对 Agent 说话。比如:
帮我生成一张博客封面图,横版,暗色调,中间有一个橙色的小吉祥物在飘浮。
Agent 会自己挑模型、写参数、调 ZOOOP、等结果。出来的图直接落在你当前项目目录里,或者贴回对话框。觉得不对劲,继续说"右边再多一点留白"就行 —— 不用重新填表单、不用再找一遍参数。
跟你直接去 ZOOOP 网站点 AI 图像生成 比起来,优势是上下文不丢:AI Agent 还记得你前面写到哪一段、文章风格是什么、配图大概要什么调性。
进阶:让 Agent 出视频 + 配一段中文配音
视频和配音同理。一个常见场景是做产品演示视频:
把刚才那张图当起始帧,生成一段 5 秒视频,镜头慢慢推近;再用一个温和的女声把这段中文配出来。
Agent 会拆成两步:先调视频生成模型(根据指令在 Veo 3.1、Kling V3、Seedance 2 之间挑一个),再调 ElevenLabs、Suno 之类的音频模型出配音,最后把两个文件都放在你能下到的地方。
复杂一点的也行 —— 跑一组 6 个分镜、给每个镜头加同一个人物的口型对齐、再统一加背景音乐 —— ZOOOP skill 把生成式画布上跑复杂剧本的那套逻辑也搬了过来,只是触发点从浏览器换成了对话框。
生成的内容,随时回 ZOOOP 网站管理与下载
这点常常被忽略,但其实是 ZOOOP skill 最让人放心的一面:通过 API key 生成的所有图像、视频、音频,都会自动同步进你 ZOOOP 账户里那个被绑定的项目。
也就是说:
- AI Agent 跑着跑着把临时文件清掉了?没关系,回 zooop.ai 项目历史页随时重新下载。
- 想把上周 Agent 帮你生的那批分镜整理成一个故事板?在网页上拖进 生成式画布 就能继续编排。
- 想从另一台电脑或者手机接着看?登录 ZOOOP 网站就能看到这个项目下 Agent 跑过的所有素材。
- 想看花了多少积分、哪个模型用得最多?项目历史页和账户用量页都有数据。
简单讲:AI Agent 那边是入口,ZOOOP 网站这边是档案库。两边数据一致,你换设备、换 Agent、换协作方式,作品都不会丢。
一些不显眼但重要的护栏
- token 不会出现在对话里。ZOOOP skill 是从环境变量里读 key,Agent 看不到也不需要看到。token 不会出现在聊天记录、截图、训练语料里。
- 每日额度上限。创建 key 时就能设当日上限,即便 key 真的泄露,损失也封顶在那一天的额度内。撤销重建只要点一下。
- 按项目隔离。一个 key 只能往它绑定的项目里写。给不同的工作流配不同的 key,互不串台。
这几条不是事后补的,是 skill 一开始就这么设计的。让 AI Agent 帮你创作可以,但不能在你不知情的时候把账户搞砸。
适合谁 / 不适合谁
适合的:平时活在终端 + IDE 里的开发者、想把 AI 生成接进自己自动化脚本的工程师、做大批量内容(博客配图、缩略图、demo 视频)需要批处理的创作者、习惯让 AI Agent 接管所有重复劳动的人。
不太适合的:想要拖拽 + 精细微调每一帧的视觉创作者 —— 这种场景下直接打开 ZOOOP 网页动手更直接;或者完全不接触 AI Agent 的人 —— 装 ZOOOP skill 对你来说多此一举,网页版用着舒服就行。
如果你已经在 Claude Code、Cursor、Codex 这类 AI Agent 里写东西,花五分钟把 ZOOOP skill 装上,基本不会后悔。生成出来的东西也都会乖乖回到 ZOOOP 网站等你 —— 这件事我们一开始就想好了。