← 返回索引

AI 行動秘書服務 — 完整規格計劃書

一、專案概述

什麼是 AI 行動秘書?

一套以 LINE 為介面AI 為核心的個人數位助理系統。使用者只需要在 LINE 上打字或傳語音,AI 就會自動幫你處理行程安排、想法歸檔、投資人管理、客戶追蹤等工作 — 不用學新軟體、不用裝新 App,手機上的 LINE 就是你的秘書辦公室。

目標客群

40-50 歲的半老闆型忙碌人士:自己帶團隊、手上有多條線要管、每天被行程和資訊轟炸。不一定是科技控,但需要有人幫忙整理混亂的日程和想法。

核心價值主張
用手機 LINE 就能操作的 24 小時數位助理。
不需要學新工具、不需要改變習慣 — 你只管說,AI 幫你記、幫你排、幫你查。

為什麼現在做?

  • 隊長是現成的第一個客戶,可以快速驗證需求
  • WT 已有 Hetzner 主機、Claude Max 額度、語音轉譯經驗 — 邊際成本極低
  • 做出 MVP 後可以量化成產品,賣給更多類似需求的人

二、功能規格

以下每個功能都經過技術可行性評估。綠色代表確定可做、黃色代表有挑戰但可行、紅色代表有風險需注意。

功能 1
LINE 訊息接收與自動回覆

系統的入口 — 所有互動都從 LINE 開始。隊長傳訊息給 LINE 官方帳號,訊息透過 Webhook 送到伺服器,AI 處理完後自動回覆。

使用情境

隊長在計程車上打「明天下午三點跟張浩開會」→ 幾秒後收到 LINE 回覆「已排入行事曆:4/22(二)15:00 與張浩開會」

技術方案

  • 申請 LINE 官方帳號(Messaging API)
  • Webhook 串接 Hetzner 上的 FastAPI server
  • 訊息接收 → Claude 分類 → 路由到對應模組 → LINE reply
確定可做 開發難度:低 預估 0.5 天
技術成熟度
LINE Messaging API 文件完善,Python SDK 穩定。WT 之前做過鯤航 LINE Bot,流程熟悉。
功能 2
語音訊息轉文字

隊長不方便打字時(開車、走路),直接對 LINE 講話。系統自動下載語音檔 → 用 faster-whisper 轉成文字 → 交給 AI 處理。

使用情境

隊長在開車,語音傳「等一下記得提醒我,下禮拜一要去銀行辦對帳」→ 系統回覆「已記錄待辦:下週一去銀行辦對帳,屆時會提醒你」

技術方案

  • LINE 語音訊息(m4a 格式)→ 透過 API 下載到本地
  • ffmpeg 轉檔(如需要)→ faster-whisper large-v3 轉譯
  • 轉譯文字送 Claude 分類處理
確定可做 開發難度:中 預估 1 天
注意:記憶體限制
Hetzner CX22 只有 4GB RAM。之前跑 Whisper 處理長音檔有 OOM 經驗。LINE 語音訊息通常在 1-3 分鐘內,問題不大。如果超過 5 分鐘要切片處理。
功能 3
AI 智能分類

所有進來的訊息(不管文字或語音轉出的文字),Claude 自動判斷類別並路由到對應處理模組。

分類類別

類別範例路由
行程「明天三點開會」→ 行事曆模組
待辦「記得打電話給王律師」→ 待辦模組
想法「拓點可以考慮中和那邊」→ 知識庫
投資人「黃毅倫放了多少錢」→ 投資人管理
客戶「陳先生保單到期了」→ CRM
查詢「我今天有什麼行程」→ 查詢模組
其他「今天天氣怎樣」→ 通用回覆

技術方案

  • 用 claude -p(Max plan 免費 CLI 額度)做分類
  • System prompt 定義分類規則和 JSON 輸出格式
  • 分類結果帶信心指數,低信心的標記「待人工判斷」
確定可做 開發難度:低 預估 0.5 天
功能 4
行事曆管理

自然語言操作 Google Calendar — 用說的就能排行程、查行程、改行程。

使用情境

  • 「幫我排明天下午3點開會」→ 自動在 Google Calendar 建立事件
  • 「我這禮拜還有什麼行程」→ 列出本週所有事件
  • 「把禮拜三的會議延到禮拜五」→ 自動修改
  • 衝突檢測:「但你禮拜五下午已經有約了,要改時間嗎?」

技術方案

  • Google Calendar API + OAuth 2.0 授權
  • Claude 解析自然語言 → 轉換成 API 呼叫參數
  • 支援建立、查詢、修改、刪除事件
  • 衝突檢測:新增前先查該時段有無其他事件
確定可做 開發難度:中 預估 1.5 天
已有經驗
WT 已有 Google Calendar API 操作經驗,OAuth 流程熟悉。API 免費額度極高(每日 1,000,000 次),完全不用擔心費用。
功能 5
商業想法歸類與知識庫

隊長腦中的商業想法、靈感、觀察 — 用語音隨手記,AI 自動分類、標籤、歸檔。日後可以用自然語言查詢。

使用情境

  • 隊長語音:「中和那邊的健身房最近在裝潢,可能可以談合作」→ AI 歸類到「健身房拓點」+ 標籤「中和、合作機會」
  • 隊長查詢:「我之前關於拓點的想法有哪些?」→ AI 列出所有相關紀錄

技術方案

  • 每條想法存成 markdown 檔案,帶 YAML frontmatter(日期、分類、標籤)
  • 資料夾結構:/clients/{id}/ideas/{category}/
  • 查詢用 grep + Claude 語意搜尋(MVP 階段不需要向量資料庫)
確定可做 開發難度:低 預估 0.5 天
功能 6
投資人管理系統

隊長有多個投資人,需要追蹤每人的投入金額、分紅紀錄、到期日等。用自然語言就能查、能改。

使用情境

  • 「黃毅倫放了多少錢」→「黃毅倫累計投入 150 萬,最近一次 2026/3/15 投入 30 萬」
  • 「誰下個月要領分紅」→「5 月份有 3 位投資人分紅到期:王大明 5/5、李建華 5/12、黃毅倫 5/20」
  • 「幫我記一下,今天陳先生又放了 50 萬」→「已新增:陳先生 2026/4/21 投入 50 萬」

技術方案

  • SQLite 儲存(輕量但結構化,支援複雜查詢)
  • 資料模型:投資人基本資料、交易紀錄(投入/提取/分紅)、合約條件
  • Claude 自然語言 → SQL 查詢 → 格式化回覆
  • 每次異動後自動備份 JSON
確定可做 開發難度:中 預估 2 天
功能 7
客戶開發追蹤(CRM)

保險業務的客戶關係管理 — 錄音摘要自動建檔、客戶背景整合、AI 談單建議。

使用情境

  • 隊長拜訪客戶後,傳一段語音摘要 → AI 自動建立/更新客戶檔案
  • 「下次去找張浩要注意什麼」→ AI 根據歷史紀錄給建議
  • 「誰的保單快到期了」→ 列出近期到期客戶

技術方案

  • 客戶資料結構:基本資料、保單紀錄、拜訪紀錄、需求標籤
  • Claude 負責從語音/文字中萃取關鍵資訊更新檔案
  • 談單建議需要較精細的 prompt engineering
有挑戰但可行 開發難度:高 預估 3 天
挑戰點
CRM 的複雜度在於:1. 從非結構化對話中準確萃取資訊需要多輪調教。2. 談單建議的品質取決於 prompt 的好壞和客戶資料的豐富度。建議放到 Phase 後期,先讓其他功能穩定。
功能 8
定時推送與提醒

AI 不只被動回答,還會主動推送 — 每日報告、行程提醒、待辦追蹤。

推送類型

類型時機內容
每日早報每天 08:00今日行程 + 待辦 + 提醒事項
行程提醒事件前 30 分鐘即將到來的行程 + 相關備註
緊急提醒事件前 10→5→1 分鐘遞進式密集提醒(可設定)
週報彙整每週日 20:00本週完成事項 + 下週預覽 + 想法統計

技術方案

  • cron job 排程 + LINE Push Message API
  • 每日早報用 Claude 彙整當日資訊,生成自然語言摘要
  • 行程提醒從 Google Calendar 讀取,提前推送
確定可做 開發難度:中 預估 1.5 天
注意:LINE 推送訊息額度
免費方案每月只有 500 則「推送」訊息(主動發的才算,回覆不算)。每日早報 + 行程提醒 + 週報,一個月大約 60-100 則推送,免費額度夠用。但如果未來多人使用就要升級。
功能 9
待人工判斷機制

AI 不是萬能的 — 當 AI 分類信心不足、或遇到模糊指令時,自動標記並推送給 WT 人工判斷。

運作流程

  1. 隊長傳了一條 AI 不確定怎麼分類的訊息
  2. AI 標記為「待判斷」,暫存不處理
  3. WT 在 Discord 收到通知:「隊長說了 XXX,我不確定要歸到行程還是待辦」
  4. WT 回覆判斷結果 → 系統執行 + 記錄這次判斷
  5. 類似的訊息下次 AI 會學會怎麼處理
確定可做 開發難度:低 預估 0.5 天
學習機制
每次人工判斷都記錄在 log 中。累積一定數量後,可以把這些案例加入 system prompt 的 few-shot examples,讓 AI 越用越準。

功能總覽表

功能 可行性 難度 時間 Phase
LINE 訊息接收 確定可做 0.5 天 Phase 1
語音轉文字 確定可做 1 天 Phase 1
AI 智能分類 確定可做 0.5 天 Phase 2
行事曆管理 確定可做 1.5 天 Phase 3
知識庫 確定可做 0.5 天 Phase 2
投資人管理 確定可做 2 天 Phase 4
CRM 客戶追蹤 有挑戰 3 天 Phase 6
定時推送 確定可做 1.5 天 Phase 5
人工判斷機制 確定可做 0.5 天 Phase 2

三、技術架構

【隊長的 LINE】
       │
       │  訊息 / 語音 / 圖片
       ▼
【LINE Messaging API】 ──── Webhook ────→ 【Hetzner CX22 FastAPI Server】
                                                      │
                                                      ├─ 文字訊息 ──→ Claude 分類器
                                                      │                    │
                                                      ├─ 語音訊息 ──→ faster-whisper ──→ Claude 分類器
                                                      │                                       │
                                                      │         ┌─────────────────────────────┤
                                                      │         │              │               │
                                                      │         ▼              ▼               ▼
                                                      │   行事曆模組    知識庫模組    投資人模組  ...
                                                      │   (Google Cal)   (Markdown)    (SQLite)
                                                      │         │              │               │
                                                      │         └──────────────┴───────────────┘
                                                      │                        │
                                                      │                        ▼
                                                      │              LINE Reply / Push
                                                      │
                                                      │  信心不足的訊息
                                                      └─────────────→ 【WT Discord 通知】
                                                                              │
                                                                       WT 人工判斷
                                                                              │
                                                                              ▼
                                                                      回寫系統 + AI 學習

技術堆疊

層級技術說明
介面層LINE Messaging API使用者唯一接觸的介面
Web 框架FastAPI (Python)接收 Webhook、路由請求
AI 引擎Claude (via claude -p)分類、理解、生成回覆
語音轉文字faster-whisper large-v3高品質中文語音辨識
行事曆Google Calendar API行程 CRUD
資料庫SQLite + Markdown結構化 + 非結構化資料
排程cron + APScheduler定時推送
伺服器Hetzner CX222vCPU / 4GB RAM / 40GB SSD
監控Discord → WT人工判斷 + 異常通知

四、資源需求與限制

1. Hetzner CX22 (2vCPU / 4GB RAM)

項目RAM 佔用狀態
LINE Bot + FastAPI~100MB沒問題
Claude -p 分析不吃本地 RAM沒問題
faster-whisper 轉譯~1.5-2GB(運行時)注意控制
WT 自己的 Claude Code~200-500MB注意排程
RAM 注意事項
Whisper 跑的時候會吃 1.5-2GB,加上系統和 FastAPI 大約 3-3.5GB。LINE 語音訊息通常很短(1-3 分鐘),處理完就釋放,問題不大。但如果同時跑 WT 的 Claude Code session,可能會擠。建議 Whisper 轉譯用 queue 排隊,不要同時跑多個。

2. Claude Max Plan 額度

用途預估日用量預估 tokens
WT 自己的 Claude Code重度使用~500K-1M/天
隊長訊息分類20-50 則/天~30-50K/天
每日報告生成1 次/天~5K/天
查詢回覆5-10 次/天~10-20K/天
額度評估
隊長的用量相對 WT 自己的用量來說很小(約 5-10%)。Max plan 的額度應該足夠涵蓋,但建議每天監控 token 消耗,避免月底額度爆掉。

3. LINE Messaging API 費用

方案月費推送訊息適用情境
免費方案NT$ 0500 則/月隊長一人用,夠
輕量方案NT$ 8005,000 則/月2-5 個客戶時升級
標準方案NT$ 1,200+依量計費10+ 客戶規模
重要:回覆 vs 推送
「回覆」不佔推送額度 — 隊長傳訊息後系統自動回覆是免費的。只有「主動推送」(每日早報、行程提醒)才算。一個人一個月約 60-100 則推送,免費方案 500 則綽綽有餘。

4. Google Calendar

  • 需要隊長一次性授權 OAuth(引導他在瀏覽器上點「允許」)
  • API 每日免費額度 1,000,000 次,完全不用擔心
  • Token 會過期,要做自動 refresh 機制

五、多租戶設計(未來擴展)

MVP 階段先做單一客戶(隊長),但架構要預留多租戶能力,日後才能量化賣給更多人。

資料隔離

/root/clients/
├── captain/                    ← 隊長的所有資料
│   ├── config.json              ← LINE token、Calendar OAuth、偏好
│   ├── ideas/                   ← 商業想法知識庫
│   │   ├── 健身房拓點/
│   │   └── 投資策略/
│   ├── investors.db             ← 投資人 SQLite
│   ├── crm.db                   ← 客戶 CRM
│   ├── todos.json               ← 待辦事項
│   └── logs/                    ← 訊息紀錄 + AI 判斷 log
│
├── client_002/                  ← 未來第二個客戶
│   ├── config.json
│   └── ...
│
└── shared/                      ← 共用資源
    ├── prompts/                 ← 分類用 system prompt
    └── templates/               ← 回覆模板

多租戶 config.json 結構

{
  "client_id": "captain",
  "display_name": "隊長",
  "line": {
    "channel_access_token": "...",
    "channel_secret": "...",
    "user_id": "U..."
  },
  "google_calendar": {
    "credentials_path": "./credentials.json",
    "token_path": "./token.json",
    "calendar_id": "primary"
  },
  "limits": {
    "daily_token_cap": 100000,
    "monthly_push_cap": 200,
    "whisper_max_duration_sec": 300
  },
  "preferences": {
    "morning_report_time": "08:00",
    "timezone": "Asia/Taipei",
    "reminder_before_min": [30, 10, 5]
  }
}

Token 計量

  • 每次 Claude 呼叫紀錄 input/output tokens
  • 每日彙總寫入 logs/token_usage.jsonl
  • 月底自動生成用量報告(可作為收費依據)
  • 接近額度上限時自動通知 WT

六、隊長實際使用流程示意

場景 1 — 行程安排
語音傳行程,自動建立日曆事件
🎤
隊長(語音):「明天下午三點跟張浩開會討論投資方案」
⚙️
系統處理:語音 → Whisper 轉文字 → Claude 分類為「行程」→ 解析時間和參與者 → Google Calendar 建立事件
💬
LINE 回覆:「已建立行程:4/22(二)15:00 — 與張浩開會討論投資方案。明天 14:30 會提醒你。」
場景 2 — 投資人查詢
自然語言查詢投資人資料
📱
隊長(文字):「黃毅倫上個月領了多少分紅」
⚙️
系統處理:Claude 分類為「投資人查詢」→ 自然語言轉 SQL → 查詢 investors.db → 格式化結果
💬
LINE 回覆:「黃毅倫 3 月份分紅 NT$ 12,500(3/20 發放)。累計投入 150 萬,年化報酬約 10%。」
場景 3 — 商業想法歸檔
語音記錄靈感,AI 自動分類存檔
🎤
隊長(語音):「今天經過中和那邊,看到一個空的店面,位置不錯,覺得可以考慮開第三家,月租好像兩萬五左右」
⚙️
系統處理:Whisper 轉文字 → Claude 分類為「商業想法」→ 自動歸類「健身房拓點」→ 標籤:中和、店面、月租 25K → 存入知識庫
💬
LINE 回覆:「已記錄到【健身房拓點】:中和空店面,月租約 2.5 萬。你目前有 4 條關於拓點的想法,要看彙整嗎?」
場景 4 — AI 不確定 → 人工判斷
AI 信心不足,推送 WT 協助判斷
📱
隊長(文字):「張浩那邊的事情要處理一下」
🤔
AI 判斷:「張浩」出現在投資人名單和客戶名單中,無法確定是指投資事務還是保險客戶追蹤。分類信心 45%。
💬
LINE 回覆:「收到,我先記下來。因為不太確定你是指投資的事還是保單的事,我請 WT 幫忙確認一下。」
🔔
WT Discord 收到:「隊長說『張浩那邊的事情要處理一下』— 張浩同時在投資人和客戶名單,請判斷分類」
WT 回覆 Discord:「投資人」→ 系統更新分類 + 記錄此判斷供未來學習

七、開發時程

以 WT 現有技術棧和經驗,預估 2-3 週可完成完整 MVP。以下是分階段時程:

Phase 1
LINE Bot 基礎 + 語音轉文字
申請 LINE 官方帳號 → Messaging API 設定 → Webhook 串接 FastAPI → 訊息收發測試 → 語音下載 + Whisper 轉譯串接
預估 1-2 天
Phase 2
AI 分類 + 知識庫 + 人工判斷
Claude 分類器 prompt 設計 → 分類路由架構 → 知識庫 markdown 存檔 → 低信心訊息推送 Discord → 人工判斷回寫機制
預估 2-3 天
Phase 3
行事曆串接
Google Calendar OAuth 授權流程 → 自然語言解析時間 → 事件 CRUD → 衝突檢測 → 行程查詢
預估 1-2 天
Phase 4
投資人管理
SQLite 資料模型設計 → 投資人 CRUD → 自然語言查詢 → 分紅計算 → 到期提醒
預估 2-3 天
Phase 5
定時推送 + 提醒
cron 排程設定 → 每日早報生成 → 行程提醒(遞進式)→ 週報彙整
預估 1-2 天
Phase 6
調教 + CRM + 優化
根據隊長實際使用反饋調教 prompt → CRM 客戶追蹤功能 → 談單建議 → 整體效能優化
持續進行
開發策略
Phase 1-2 完成後就可以讓隊長開始試用基本功能(收訊息 + 分類 + 存檔)。邊用邊調,後面的功能逐步上線。不用等全部做完才給隊長用。

八、商業模式與定價建議

隊長先免費用(你們的合作關係),驗證模式後再對外收費。以下是對外定價參考:

基礎版
NT$ 1,500/月
  • LINE 訊息接收 + AI 回覆
  • 語音轉文字
  • AI 智能分類
  • 行事曆管理
  • 商業想法歸檔
  • 每日早報 + 行程提醒
  • 每月 token 上限 3M
客製版
NT$ 5,000+/月
  • 進階版全部功能
  • 客製化模組開發
  • 專屬 prompt 調教
  • 多平台整合
  • 無限 token(公平使用)
  • 1 對 1 顧問服務
  • 依需求報價

合約建議

  • 合約期:3 個月一期,首期試用可打折
  • 服務範圍:合約載明包含的功能模組和 token 上限
  • 超額計費:token 超額每 1M tokens 加收 NT$ 200
  • 退出機制:合約到期可不續約,資料匯出
  • SLA:每月正常運作時間 95%+(考量 Hetzner 單機限制,不承諾 99.9%)

成本結構

項目月成本備註
Hetzner CX22~NT$ 250已有主機,邊際成本 0
Claude Max plan~NT$ 6,500WT 自用,額度共享
LINE APINT$ 0-800視客戶數量
WT 維護時間視情況初期每週 2-3 小時
毛利分析
以進階版 NT$ 3,500/月為例,硬體邊際成本幾乎為 0(Hetzner 和 Claude 都是已有的資源)。主要成本是 WT 的維護時間。如果有 3 個客戶,月收入 NT$ 10,500,扣掉 LINE 升級費 NT$ 800,毛利超過 90%。

九、風險與挑戰

1
LINE 語音訊息格式限制
LINE 語音是 m4a (AAC) 格式。faster-whisper 理論上支援,但需要實測確認品質。如果有問題,用 ffmpeg 先轉 wav 再丟 Whisper — 多一步但穩定。
中度風險 — 有備案
2
Hetzner 4GB RAM 限制
Whisper 運行時吃 1.5-2GB,如果同時有其他程序(WT 的 Claude Code),可能 OOM。對策:Whisper 用 queue 處理,一次只跑一個任務。真的不夠再考慮升級 CX32(8GB)。
中度風險 — 可管理
3
Claude Max plan 額度共用
WT 自己的重度使用 + 隊長的 bot 共用同一個帳號的額度。如果月底 WT 自己的額度不夠用,可能會影響隊長的服務。對策:監控每日用量、設定 bot 每日上限、尖峰時段優先 WT 自用。
中度風險 — 需監控
4
隊長的使用習慣適應期
40 多歲的使用者可能不習慣對 AI 下指令。初期需要手把手教學 + 適應期容忍度。對策:做一份簡單的使用教學、前兩週密切追蹤使用情況、根據反饋快速調整 AI 回覆風格。
低度風險 — 可控
5
資安:投資人資料存在主機上
投資人名字、金額等敏感資料存在 Hetzner 主機上。雖然只有 WT 能 SSH 進去,但理論上有風險。對策:SQLite 加密(SQLCipher)、定期備份、資料脫敏選項、合約載明資安責任。
需注意 — 涉及法規
6
單點故障:Hetzner 掛了全部停擺
所有服務都跑在同一台 Hetzner 上,如果主機掛了,隊長的 AI 秘書就停擺。對策:關鍵資料每日備份到 GitHub Private Repo、考慮 systemd 自動重啟、未來客戶多了再做冗餘。
中度風險 — MVP 可接受