← 索引

Google Flow 完整研究報告

Google Flow 是 Google 的 AI 影片製作工具,以 Veo 模型為核心引擎。
定位:不只是「文字轉影片」,而是完整的 AI 電影製作工作流程。
研究日期:2026-05-20|官網:labs.google/flow

一、Google Flow 是什麼?

項目內容
正式名稱Google Flow
底層模型Google DeepMind Veo(最新:Veo 3.1)
推出日期2025 年 5 月 20 日(Google I/O 2025)
前身VideoFX(Google Labs 早期實驗項目)
官網labs.google/flow
覆蓋範圍140+ 國家/地區
Flow 與 Veo 的關係:
- Veo = 底層 AI 模型(Google DeepMind 開發)
- Flow = 消費端創作介面(Google Labs 開發,呼叫 Veo API)
- 關係類似 ChatGPT 之於 GPT-4
- 開發者可直接透過 Gemini API / Vertex AI 呼叫 Veo,不一定要用 Flow 介面

Flow 的定位是「面向創作者的 AI 電影製作工具」,提供從概念發想、角色設計、場景建構、鏡頭控制到多鏡頭敘事的完整創作流程。是目前市場上少數明確瞄準「長敘事影片」場景的 AI 工具。

二、核心功能與能力

基礎生成

進階創作工具

工具功能
Scene Builder延伸片段,保持角色與場景一致性,生成「接下來發生什麼」
Camera Controls精確指定鏡頭運動 — 平移、縮放、推拉、旋轉
Ingredients建立角色/道具/場景元素庫,跨場景保持視覺一致性
Lasso 工具框選局部區域進行精確編輯
自然語言編輯用文字指令修改影片(如「移除畫面中的男人」「加入錦鯉」)
物件新增/移除從生成的影片中增加或刪除物件

2026 年新增功能 NEW

功能說明
Flow AgentAI 創作夥伴 — 腦力激盪劇情、建議台詞、批次編輯、同時生成多版本
Flow Tools用自然語言建立自訂工作流程(無需寫程式),可分享給社群
Whisk + ImageFX 整合圖片生成功能移入 Flow,統一成單一工作區
Gemini Omni Flash結合 Gemini 推理 + 生成媒體,強化角色一致性、多媒體輸入輸出

Flow Music(獨立工具)

三、技術規格

規格Veo 3.1 數據
最高解析度4K(3840×2160),2026/01 新增
支援解析度720p / 1080p / 4K
幀率24fps(預設)/ 30fps / 60fps
單次生成長度4 / 6 / 8 秒(可選)
最長可輸出透過片段接續可達 2 分鐘+(每段延伸 ~7 秒,最多 20 次)
畫面比例16:9(橫式)/ 9:16(直式)
音頻原生音頻生成(音效、環境音、對話同步)
浮水印SynthID 數位浮水印(不可見)
支援輸入文字、圖片、影片、音訊(Gemini Omni 模式)

Veo 模型版本演進

版本時間重點
Veo 12024 年有限預覽
Veo 22024 年底Flow 初期核心模型
Veo 32025/05 I/O首個原生音頻同步模型
Veo 3.12025/10畫質提升、音訊對齊改善
Veo 3.1 Fast2025更快速、成本更低
Veo 3.1 Lite2026成本最低,適合大量生成

四、定價與訂閱方案

消費端(Flow 介面)

I/O 2026 後改為「運算積分制」— 不再是固定次數,複雜的影片提示消耗積分遠多於文字提示。圖片生成功能現為免費。
方案月費雲端儲存Flow / Veo 額度
Google AI Plus$7.99200 GB基本額度
Google AI Pro$19.995 TB4 倍額度 + YouTube Premium Lite
Google AI Ultra$99.99 起20 TB20 倍額度 + 優先最新模型 + YouTube Premium

可購買額外的 Pay-as-you-go 積分。Google Vids(Workspace 工具)提供每月 10 部免費影片。

開發者 API 定價 API

模型定價適用場景
Veo 3(完整版)$0.40/秒最高品質
Veo 3 Fast$0.15/秒速度優先
Veo 3.1 Lite~$0.05/片段大量生成,比 Fast 便宜 50%+

五、競品比較

主要競品一覽

工具開發商最長時長最高畫質原生音頻起始月費
Google Flow / Veo 3.1Google8秒(可接續 2分鐘+)4K最強$7.99
Runway Gen-4.5Runway AI10 秒1080p-$12
Kling 3.0快手10 秒4K含唇形同步$8
Pika 2.5Pika Labs10 秒1080p~$8
HailuoMiniMax6 秒1080p-Pay-as-you-go
Luma Ray 3Luma AI10 秒1080p-$29.99
SoraOpenAI60 秒1080p-已宣布關閉
Sora 已宣布停止服務:網頁/App 於 2026/04/26 關閉,API 於 2026/09/24 關閉。

各維度誰最強?

評比維度最佳選擇說明
整體畫質/寫實感Runway Gen-4.5 / Veo 3.1並列,Runway Elo 1,247 分居冠
音頻同步Veo 3.1(獨家領先)唯一同時生成影音,音效+對話+環境音全含
人物動作自然度Kling 3.0 / Hailuo臉部表情與身體動作最自然
多鏡頭敘事一致性Google Flow唯一專為跨場景多鏡頭故事設計
物理模擬Veo 3.1液體、布料、頭髮模擬
後製控制靈活度Runway / Pika後製編輯工具最完整
4K 輸出Veo 3.1 / Kling 3.0兩者均支援原生 4K
社群短影音PikaPikaffects/Pikaswaps 針對 Reels/TikTok 優化
企業/商業用途Runway最貼近傳統後製流程
Flow 的核心差異不在單段畫質,而在:
1. 多鏡頭一致性 — 角色、道具、光影跨場景連貫
2. 完整創作流程 — 素材管理到鏡頭控制,不只是「生一段影片」
3. 原生音頻 — 競品均需後製另接音軌
4. Google 生態整合 — Gemini、Imagen、Workspace 深度連動

六、適用對象與使用場景

適合誰用

對象怎麼用
獨立電影工作者多鏡頭場景一致性、鏡頭語言控制
YouTuber / 影片創作者快速生成 B-Roll、情境畫面
廣告創意人員品牌概念影片快速原型
社群媒體創作者Flow Music 製作 AI MV、9:16 直式短影音
遊戲/動畫概念設計師視覺開發、場景測試
開發者透過 Veo API 建立影片生成應用

具體場景

七、已知限制

功能限制

技術問題

存取限制

八、I/O 2026 最新動態 HOT

2026/05/19-20 I/O 2026 重大更新

  1. Gemini Omni Flash 整合 — 結合 Gemini 推理 + 生成媒體,支援多媒體輸入生成高品質影片,可透過對話持續修改
  2. Flow Agent 全面開放 — AI 創作夥伴升級,支援腦力激盪、批次編輯、多版本平行生成
  3. Flow Tools — 自然語言建立無程式碼工作流程,可分享給社群
  4. 行動 App 上線 — Flow App(Android Beta)、Flow Music App(iOS 已上線)
  5. Flow Music 升級 — 分段精確編輯、封面翻唱、Gemini Omni MV
  6. 訂閱方案重整 — Plus $7.99 / Pro $19.99 / Ultra $99.99 起,改為運算積分制

2026/02 更新

2026/01

九、如何開始使用

  1. 前往 labs.google/flow
  2. 用 Google 帳號登入(需年齡驗證 18+)
  3. 訂閱 Google AI Plus($7.99)/ Pro($19.99)/ Ultra($99.99 起)
  4. 點選「New Project」開始創作
  5. 透過「Flow TV」參考他人作品及提示詞學習

入門建議

十、開發者 API API

存取方式

Python 範例

from google import genai
from google.genai.types import GenerateVideosConfig

client = genai.Client(api_key="YOUR_API_KEY")

response = client.models.generate_videos(
    model="veo-3.0-fast-generate-001",
    prompt="A cinematic shot of a lighthouse at sunset",
    config=GenerateVideosConfig(
        aspect_ratio="16:9",
        resolution="1080p",
        negative_prompt="blurry, low quality"
    )
)

API 模型選擇建議

使用場景建議模型理由
高品質製作Veo 3.1(完整版)最佳畫質音質
速度優先Veo 3.1 Fast快速回應,成本 $0.15/秒
大量/高頻生成Veo 3.1 Lite成本最低,~$0.05/片段

十一、總結評估

強項

  • 音頻同步生成業界唯一且領先
  • 多鏡頭敘事一致性是業界最強定位
  • 4K 輸出(業界少數)
  • Gemini 生態深度整合,延伸性強
  • API 定價有競爭力
  • I/O 2026 後功能大幅擴充

弱項

  • 單段 8 秒上限,接續多段仍較繁瑣
  • 提示詞限英文,中文創作者門檻高
  • 行動 App 剛起步,iOS 未上線
  • 音頻功能仍不穩定(實驗性)
  • 部分地區受限

怎麼選?

需求選擇
音頻同步 + 多場景一致性 + 電影感Google Flow
廣告製作 + 精細後製控制Runway
人物動作 + 4K 唇形同步Kling 3.0
社群短影音 + 快速特效Pika
開發者大量生成Veo 3.1 Lite API(性價比最高)
對 WT 的潛在價值:
- 影片製作接案可以用 Flow 做快速分鏡原型(Previz),降低提案成本
- 鯤航教學影片可以用 AI 生成情境畫面(海洋、遊艇場景)補充 B-Roll
- Flow Music 可以為影片專案快速產出配樂
- Veo API 可以整合進 AI 剪輯 pipeline