Compoundology Studio
豐富你的腦,存滿你的包
虛擬 AI 辦公室
點擊角色查看詳細資訊 · 點擊房間顯示功能面板
Live Canvas
📖
尚未載入書籍
集數: - · 總頁數: - · 狀態: -
文案撰寫
集數規劃、PDF 擷取、知識萃取、NotebookLM Prompt、Spotify 介紹文與後續發布素材
產出庫選書
雲端路徑 Podcasts/文案/{分類}/{書名}/。先選分類,再選書並按載入,會帶入右側「集數規劃」與本欄下方「工作區預覽」的集數選單。
分類
工作區預覽
選擇來源集數後載入雲端檔案。Prompt 可複製 fenced 主體或整份 MD;Spotify 介紹可複製全文(貼上 Podcast 後台);YouTube 貼文 Caption 會直接重組 Spotify 內容與標題。
來源

        
集數規劃
每本書獨立資料夾,PDF 請放在該書資料夾內的 PDF/;② 擷取章節 TXT 寫入 轉TXT/,③ 知識萃取 MD 寫入 知識萃取/
填好路徑後可偵測頁數;「掃描字數」會逐頁統計文字層字元(插圖/掃描頁常接近 0),建議在 ① 規劃前先掃描。
還沒按 ①、或重新整理後集數清單不見,但雲端已有知識萃取報告或 PDF 擷取檔時:可在此直接還原 episode_plan.json(請先填書名並與 Podcasts 資料夾一致;總頁數請與最後一集結束頁相同)。優先讀知識萃取表頭的「來源」TXT 檔名,章節欄會比純猜 TXT 準。
Book 分類批次:資源庫為 Podcasts/Book/{分類}/*.pdf——也就是 Book 底下每個子資料夾(Finance、Literature、Psychology…)各自一類。預設按鈕只掃描上方「分類」欄那一格(placeholder 常是 Literature,所以只看 Literature 很正常)。若要一次掃五個資料夾,請用「掃描全部分類」。產出寫入 Podcasts/文案/{分類}/{檔名}/;一鍵會對「待處理」書籍跑規劃/擷取/知識萃取。
掃描摘要:請先按「掃描此分類」或「掃描全部分類」,此處會顯示統計與明細。

            
精品知識包 (雜誌風格 IG Carousel)

依據知識萃取生成 6 頁雜誌風格文案,並自動渲染為 PDF。產出存放於 知識包/ 資料夾。

音檔混音
NotebookLM 人聲 + 本書約 1 分鐘背景樂 → 依集數輸出至「成品音檔」資料夾(與文案撰寫同書籍路徑,Google Drive 會同步)
1. 選定書籍
分類
需已有 episode_plan.json 集數資料;若剛規劃完,請先在文案撰寫按「儲存至 Google Drive」。
NotebookLM 一鍵人聲

掃描該書 Prompt/EP**_NotebookLM_Prompt.md只補缺少的人聲,並下載至同層資料夾 NotebookLM音檔。請先於終端機執行 pip install -r requirements-notebooklm.txtnotebooklm login(見 docs/NOTEBOOKLM_SETUP.md)。單集生成可能極久,請勿關閉此分頁。

1200=先等約 20 分鐘再開始 artifact wait 與下載,較不易遇到「雲端還沒做完就下載」而失敗。此期間請勿關分頁,且反向代理/瀏覽器逾時須夠長。

例:https://notebooklm.google.com/notebook/67683829-b476-433a-907e-...

上去下載人聲:跳過送出生成,直接去 NotebookLM 抓已完成的音檔。Notebook URL/ID 若不填則自動從上次批次記錄讀取。每集最多等 60 秒

2. 本書背景音樂(約 1 分鐘)
拖曳音樂檔至此
支援 wav / mp3 / m4a 等。背景會循環鋪底,前 30 秒偏片頭感、後 30 秒偏片尾感(不足則對半切)。
3. 各集 NotebookLM 人聲

可拖曳上傳至下方(寫入暫存 _mixer_inbox,混音時優先於資料夾 NotebookLM音檔);或使用上方「一鍵」自動下載至 NotebookLM音檔

請先選擇書籍。
4. 混音並存檔

需本機已安裝 ffmpegbrew install ffmpeg)。背景音樂會自動循環鋪底:前 6 秒維持全音量、6–8 秒漸降到約 20%,之後維持低音量;尾段則以 NotebookLM + Podcast Ending 為主要音軌,並讓背景音樂在主要音軌結束前 40 秒開始重疊,最後 5 秒只剩背景音樂。按鈕會先掃描成品音檔,只補混還沒做好的集數。成品:EP##_成品.m4a

圖片
依知識萃取生成莫內風背景與 1080×1350 發文圖。背景存 文案/{分類}/圖庫/;Reels 主段落 flip 用圖集結在 文案/{分類}/圖庫/書卡/。貼文存 文案/{分類}/{書名}/IG發文圖/(需 GEMINI_API_KEY、Pillow)
1. 選書與集數
分類
需先有該集 知識萃取(產 IG/對 caption 要選集數)。若尚無 episode_plan.json,集數會改由知識萃取檔名自動列出。
2. Reels 書卡(片頭+分類書卡池)

每本書一張片頭書卡:Reels/book_card.png(2–5 秒書名轉場,與集數無關)。流程:以書籍主題向 Gemini 生成英文圖像 prompt → 出 9:16 背景圖 → Pillow 合成書名、作者、底欄 slogan(需 GEMINI_API_KEY;未設定則以 Pillow 黑底備援)。 若 book_card.png 已存在,預設不重繪;勾選強制重產才會覆寫。

書卡上「作者」欄位的來源優先級:① 此欄② episode_plan.json 的 author 欄③ 書名含「 -- 作者」格式
填入後會自動寫入 episode_plan.json(不影響其他欄位)。

「此分類」取自左欄所選分類。

3. 生成 IG 發文圖

會呼叫圖像模型產生背景,再以公版合成貼文圖。單集或整本批次皆可。 金句優先使用 Spotify 介紹文裡「」內且含中文的句子;若無則改從知識萃取【E】等區塊的「」內挑含中文者;仍沒有則貼提示文字(不會再擷取純英文當主金句)。


        
4. Book 分類批次(補齊 IG 圖)
掃描資料源為 產出庫 Podcasts/文案/{分類}/ 底下每一個書籍資料夾(不再依 Book 資源庫 PDF 清單反查)。「此分類」只掃一個文案分類;「全部分類」掃 文案/ 下每一子資料夾。
掃描摘要:請先按「掃描(IG 缺檔)」,此處會顯示共幾本對應書、幾本有缺檔、合計幾集待補。

        
流程位置

建議順序:文案撰寫(③ 知識萃取)→ 混音圖片(此頁)→ 影片(Reels)。

影片
Reels 約 45 秒:0-2 秒 Hook 並唸完開場([thoughtful] 第一句+「來自。」)、2-5 秒書卡跑馬燈、5 秒後從《書名》開始唸主內容;跑馬燈書卡優先Podcasts/文案 下所有分類隨機挑選,並排除正在生成的那一本;主段落背景圖優先從分類 圖庫/書卡/ 隨機挑選;主畫面直幅 9:16,疊加書名、作者 / 著、底欄 slogan,字幕約2/3 高度
1. 選書與集數
分類
需先有該集 知識萃取(Reels 生成必要)。若尚無 episode_plan.json,集數會改由知識萃取檔名自動列出。
4. YouTube 封面圖(1920×1080)

從 Spotify 介紹文擷取金句,疊加在 memo.png 上,搭配分類圖庫背景圖,生成 16:9 封面。 輸出至書籍目錄下的 YouTube影片/EP{num}_thumbnail.png

5. YouTube 影片生成

組合 open.mp4(開頭)+ 封面圖(靜態畫面)+ NotebookLM 音檔 + BGM(_mixer_inbox/bed.mp3)。 輸出至 YouTube影片/EP{num}_youtube.mp4
前置需求:封面圖已生成 + NotebookLM 音檔已存在 + BGM(可選)

批次生成會依序處理所有集數(含封面圖),時間較長請耐心等候。


          
          
集數輸出狀態
2. 文案預覽(知識萃取 → Gemini → ElevenLabs 輸入)

按「載入預覽」會呼叫 Gemini 產出分句;前兩行為 intro(第 1 行以 [thoughtful] 起頭;第 2 行固定為「來自。」),第 3 行起為主內容。主內容建議第 3 行只放書名(可加 [thoughtful] 等標籤;書名「》」後加全形句號)、第 4 行以 [long pause]—(em dash)再接正文。下方「畫面上字幕參考」為影片燒錄字幕預覽。 若先改好「送進 ElevenLabs」欄再按全流程,後端不會再重跑 Gemini,會直接用你編輯後的文字。


          
          
          
          

        
3. 全流程生成 Reels 影片(約 45 秒)

需先有該集 知識萃取,並準備 assets/reels-hook.mp4、(可選)assets/reels-tada.mp3。 背景音樂與 Podcast 混音同一支:請先在「混音」頁把本書背景樂拖進該書 _mixer_inbox/bed.*(與一鍵混音相同)。 主段落素材請先在「圖片」→ Reels 書卡 匯入 圖庫/書卡/,或於圖庫根目錄放背景圖作備援;跑馬燈則會跨所有分類抽書卡,並自動排除本書。若該集已存在 intro/body ElevenLabs 音檔,全流程會重用音檔,避免重扣字數。

批次生成預設跳過已存在的 MP4;「此分類」取自左欄所選分類。


        
IG Caption
(生成 Reels 或「載入預覽」後自動填入)
社群管理
IG 自動私訊追蹤 + 貼文 / Reels 發布管理
📨 自動私訊管理
Post Mapping 設定
執行控制
已聯繫用戶紀錄
📤 發文管理
選書與集數
分類
發文類型
預覽區
選書、選集後按「預覽」顯示內容
發布狀態追蹤
服務整合狀態
即時檢查所有本地服務與外部平台,並設定全域 AI 大腦
🧠 AI 員工大腦配置 (全域連線)
在此切換各 AI 員工背後的運算模型。所有需要呼叫 LLM 的地方皆會套用此設定。
💡 提示:目前預設為 ModelScope / DeepSeek V4 Flash(文字)與 ModelScope / Tongyi-MAI/Z-Image-Turbo(圖片),金鑰皆由 .env 自動套用。
本地服務
雲端平台
Google Drive 狀態