
讓你的 AI Agent 直接出圖、出影片、出配音 —— ZOOOP skill 上手指南
寫著一篇文件,突然覺得這裡缺張配圖。
以前的做法是:打開瀏覽器、找一個 AI 生圖站、登入、複製 prompt、調參、等圖、下載、拖回專案。來回切八九下,中間還可能被推播、被彈窗、被 Discord 訊息打斷。
ZOOOP skill 就是把這一整套流程壓回 AI Agent 對話框裡。你在 Claude Code、Cursor、Codex、Gemini CLI 這類 AI Agent 裡說一句「給這段加張配圖,橫版、暗底、有一隻小機器人飄浮」,Agent 自己去呼叫 ZOOOP,幾十秒後圖就貼回到對話裡。
為什麼要把 AI 生成交給 AI Agent
AI Agent 已經接管了大半個寫程式、寫文案的流程。但凡需要一張圖、一段影片、一段配音,創作者還是得回到瀏覽器。這個情境切換,是當前 AI 創作工作流裡最破碎的環節之一。
ZOOOP skill 的思路其實很簡單:既然 AI Agent 已經在你旁邊,就讓它順手把生成這件事也辦了。你不用學新工具、不用切視窗,告訴 Agent 你想要什麼,它會用你 ZOOOP 帳戶裡的額度去生。
ZOOOP skill 能讓 AI Agent 做什麼
裝上之後,你的 AI Agent 就能呼叫 ZOOOP 上幾乎所有的生成能力。常見的幾類:
- AI 圖像生成:一句話出圖、參考圖改風格、按角色出多張
- AI 圖像編輯:局部擦掉、換物體、補背景
- AI 影片生成:文字生成影片,接入了 Veo 3.1、Kling V3、Seedance 2、Nanobanana……
- 首尾幀生成影片:給一張靜態圖加動作
- 口型對齊:讓人物根據音訊開口說話
- AI 配音 與聲音克隆:文字轉語音,或克隆指定嗓音
- AI 音樂 與音效:背景配樂和環境音
也就是說,日常做內容裡所有用得到 AI 生成的環節,基本都能讓 AI Agent 一句話搞定。
裝一次,主流 AI Agent 都能用
ZOOOP skill 不綁定單一 Agent 平台。Claude Code、Codex、Cursor、Gemini CLI,以及其他相容 skill / MCP 協定的客戶端,裝一次就能跨工具複用。
步驟大致是這樣:
-
去 zooop.ai 使用者中心建立一個 API key,綁定到某個專案,順手設一個每日額度上限。
-
在自己電腦的終端機裡,把 key 寫進環境變數
ZOOOP_API_KEY(不要貼到 Agent 對話框裡)。 -
安裝 skill。最簡單的方式是直接把 GitHub 連結 github.com/zooopai/skill-zooop 丟給你的 AI Agent,讓它自己看 README 裝上 —— 現在的 Agent 普遍認得這種「看儲存庫自己裝」的指令,基本不用你操心命令格式。
-
想自己手動跑命令也行。跨 Agent 的統一方式:
npx skills add zooopai/skill-zooopClaude Code、Cursor、Codex、Gemini CLI、GitHub Copilot、Windsurf 等幾十個客戶端都認這條。想只裝到特定 Agent,加
-a參數:npx skills add zooopai/skill-zooop -a claude-code -a cursorClaude Code 使用者也可以走原生指令,效果一樣:
claude install github:zooopai/skill-zooop -
重啟 Agent,讓它讀到環境變數。
整個過程不到五分鐘,而且 AI Agent 不需要自己去翻 API 文件 —— skill 裡已經把「什麼情境用哪個生成類型」、「參數怎麼填」、「出錯怎麼辦」全寫好了,Agent 一邊讀一邊就會用。
第一次用:讓 AI Agent 出一張圖
最簡單的入門方式,就是直接對 Agent 說話。比如:
幫我生成一張部落格封面圖,橫版,暗色調,中間有一個橘色的小吉祥物在飄浮。
Agent 會自己挑模型、寫參數、呼叫 ZOOOP、等結果。出來的圖直接落在你目前專案目錄裡,或者貼回對話框。覺得不對勁,繼續說「右邊再多一點留白」就行 —— 不用重新填表單、不用再找一遍參數。
跟你直接去 ZOOOP 網站點 AI 圖像生成 比起來,優勢是上下文不丟:AI Agent 還記得你前面寫到哪一段、文章風格是什麼、配圖大概要什麼調性。
進階:讓 Agent 出影片 + 配一段中文配音
影片和配音同理。一個常見情境是做產品 demo 影片:
把剛才那張圖當起始幀,生成一段 5 秒影片,鏡頭慢慢推近;再用一個溫和的女聲把這段中文配出來。
Agent 會拆成兩步:先呼叫影片生成模型(根據指令在 Veo 3.1、Kling V3、Seedance 2 之間挑一個),再呼叫 ElevenLabs、Suno 之類的音訊模型出配音,最後把兩個檔案都放在你能下載到的地方。
複雜一點的也行 —— 跑一組 6 個分鏡、給每個鏡頭加同一個人物的口型對齊、再統一加背景音樂 —— ZOOOP skill 把生成式畫布上跑複雜劇本的那套邏輯也搬了過來,只是觸發點從瀏覽器換成了對話框。
生成的內容,隨時回 ZOOOP 網站管理與下載
這點常常被忽略,但其實是 ZOOOP skill 最讓人放心的一面:透過 API key 生成的所有圖像、影片、音訊,都會自動同步進你 ZOOOP 帳戶裡那個被綁定的專案。
也就是說:
- AI Agent 跑著跑著把暫存檔案清掉了?沒關係,回 zooop.ai 專案歷史頁隨時重新下載。
- 想把上週 Agent 幫你生的那批分鏡整理成一個故事板?在網頁上拖進 生成式畫布 就能繼續編排。
- 想從另一台電腦或手機接著看?登入 ZOOOP 網站就能看到這個專案下 Agent 跑過的所有素材。
- 想看花了多少點數、哪個模型用得最多?專案歷史頁和帳戶用量頁都有資料。
簡單講:AI Agent 那邊是入口,ZOOOP 網站這邊是檔案庫。兩邊資料一致,你換裝置、換 Agent、換協作方式,作品都不會丟。
一些不顯眼但重要的護欄
- token 不會出現在對話裡。ZOOOP skill 是從環境變數裡讀 key,Agent 看不到也不需要看到。token 不會出現在聊天紀錄、截圖、訓練語料裡。
- 每日額度上限。建立 key 時就能設當日上限,即便 key 真的外洩,損失也封頂在那一天的額度內。撤銷重建只要點一下。
- 按專案隔離。一個 key 只能往它綁定的專案裡寫。給不同的工作流配不同的 key,互不串台。
這幾條不是事後補的,是 skill 一開始就這麼設計的。讓 AI Agent 幫你創作可以,但不能在你不知情的時候把帳戶搞砸。
適合誰 / 不適合誰
適合的:平時活在終端機 + IDE 裡的開發者、想把 AI 生成接進自己自動化腳本的工程師、做大批量內容(部落格配圖、縮圖、demo 影片)需要批次處理的創作者、習慣讓 AI Agent 接管所有重複勞動的人。
不太適合的:想要拖曳 + 精細微調每一幀的視覺創作者 —— 這種情境下直接打開 ZOOOP 網頁動手更直接;或者完全不接觸 AI Agent 的人 —— 裝 ZOOOP skill 對你來說多此一舉,網頁版用著舒服就行。
如果你已經在 Claude Code、Cursor、Codex 這類 AI Agent 裡寫東西,花五分鐘把 ZOOOP skill 裝上,基本不會後悔。生成出來的東西也都會乖乖回到 ZOOOP 網站等你 —— 這件事我們一開始就想好了。