Google I/O大會亮點-Veo3&flow│從AI 影片生成到AI導演,直接跳級分鏡電影敍事風格及音樂音效同步

從 Google I/O 到全球開放,解析 Veo 3 技術特色、應用潛力與產業衝擊

2025 年 5 月 20 日,Google 在年度開發者大會 Google I/O 上揭示了一場 AI 革命,核心主題圍繞著 “AI First Everything”。CEO Sundar Pichai 宣示,AI 將成為 Google 全產品線的基礎架構。整場大會中,多項旗艦級技術同步亮相:

Veo 3 正式登場:作為 AI 創作生態的核心影片引擎,融合影像與音訊生成,成為全場矚目焦點。

Gemini 2.5 Pro 與 Flash:具備更快推理與語境記憶能力,強化 AI 生產力。

Gemini Live(前稱 Project Astra):整合視覺、語音與網頁互動的即時對話助理。

Agent Mode(Project Mariner):讓 AI 理解使用者目標,自主搜尋與執行任務。

Imagen 4 圖像生成器:提供更高解析度與細節掌控的圖像創作能力。

Flow 影片創作工具:支援分鏡、敘事節奏與電影級風格設計。

Veo 最初由 DeepMind 團隊主導開發,是 Google 旗下的文字轉影片(Text-to-Video)AI 模型,歷經三代發展。Veo 3 於 I/O 大會中隆重亮相,被定位為 “創作者的虛擬導演”。技術上,它具備下列創新特點:

  • 支援 1080p/60fps 的高畫質影片輸出
  • AI 同步音訊生成:能為場景自動生成環境音與配樂。
  • 多鏡頭場景控制:可依據文字提示產出具有連續敘事邏輯的段落。
  • 風格模擬能力:支援動畫、寫實、黏土、漫畫等風格切換。
  • 角色一致性維持:讓角色在多個鏡頭中外觀與動作更連貫(目前仍是業界難題)。
  • 多模態輸入理解:可搭配照片、影片片段、草稿分鏡進行生成。

專為創作者打造:Flow 讓使用者像操作積木一樣,透過拖曳分鏡元件(SceneBuilder)、輸入文字提示與上下文,來決定場景走向與鏡頭轉場方式。

對接 Veo 3 與 Imagen 4:Flow 運作時會同時串接 Veo 3(負責影片動態與音訊生成)與 Imagen 4(負責影像細節與品質),全方位打造高畫質、有節奏感的短片

攝影機控制 (Camera Controls):演講中示範如何設定鏡頭運鏡方式,包括移動軌跡、推拉鏡頭(dolly)、平移(pan)、及變焦(zoom),讓影片具備「電影級」運鏡感 。

連續鏡頭擴展 (Scenebuilder):可以讓場景不中斷接續,比如從一本書的近拍轉到角色翻頁。使用者可依語意控制鏡位與切換,Flow 自動生成每段鏡頭與敘事節奏

Flow TV 展示 (Flow TV):演講中提及可瀏覽由社群創作的範例影片,並查看使用的 prompt 與鏡頭設定,強調 Flow 具學習借鑒功能 。

同步聲音 (Synchronized Audio):與 Veo 3 合作,Flow 可以產生對白、環境音與背景音樂,且聲音會自動配合嘴型、動作與氛圍,如雨聲、風聲、腳步聲等 。

情境語調調整:可在每段鏡頭中設定聲音情緒,例如悲傷、興奮或平緩,Flow 自動調整配樂與語調節奏,讓短片具備情緒張力 。

素材管理 (Asset Management):Flow 提供管理文字提示、圖像參考與素材片段的功能,讓創作者更系統化地編排專案內容 。

VEO3與Flow 時間軸:1:28:00-1:37:30

雖然 Veo 3 在 5 月 I/O 大會亮相後即備受關注,但正式開放使用則分階段進行。Google 採取與 Gemini App 整合的策略,僅開放給 AI ProAI Ultra 訂閱用戶使用,並率先於北美、歐洲 150 多國推出。

在台灣,Google 官方於宣布於 2025 年 7 月 3 日 開放生成,Veo 3 透過 Gemini App 提供給付費用戶試用,使用者只需開啟 Gemini App,進入「照片轉影片」功能頁面,即可輸入描述文字或上傳靜態圖,生成一段約 8 秒、具備背景音效的影片。

Latest

如何讓AI找到你的網站,優化SEO、AEO完整流程與必做清單懶人包

.seo-article { max-width: 860px; margin: 0 auto; font-family: "Noto Sans TC", "微軟正黑體", sans-serif; font-size: 16px; line-height: 1.9; color: #1a1208; } .seo-article .intro-box { border-left: 4px...

2025 COMPUTEX登場 聚焦AI驅動技術5/19 NVIDIA 輝達執行長黃仁勳率先北流演說揭序幕

台北國際電腦展COMPUTEX2025 展覽地點:南港展覽館一、二館 展覽日期:2025/5/20-5/23 台北國際電腦展COMPUTEX 2025 於5/20在南港展覽館一、二館盛大登場,展期自5/20開放至5/23為期4天。 2025 COMPUTEX共計來自25個國家與各地區1,400家廠商參展,展出攤位規模達4,800個。今年展覽主軸為「AI Next」,主辦單位聚焦三大領域:「智慧運算與機器人」、「次世代科技」與「未來移動」,反映AI技術擴散至通訊、車用、製造等產業的趨勢。 https://www.youtube.com/watch?v=qzHlOs7PCHk 影片來源: COMPUTEX 2025: AI NEXT 多位國際科技企業高層將於展期間發表Keynote演講,包括NVIDIA執行長黃仁勳、Qualcomm執行長Cristiano Amon、鴻海董事長劉揚偉、聯發科執行長蔡力行與恩智浦執行副總裁Jens Hinrichsen,主題涵蓋通訊、車用、邊緣運算與智慧製造等AI應用情境。 COMPUTEX 重磅主題演講資訊整理 (資料持續更新) 【5/19:11:00~12:30 NVIDIA CEO JASON KEYNOTE輝達執行長黃仁勳】 主題方向:分享AI與加速運算技術的最新進展與突破,以輝達在AI與加速運算領域的最新突破為核心,深度解讀旗下Blackwell GPU架構與RTX 50系列,並展示NVIDIA Omniverse如何透過即時3D協作平台,支持製造、汽車、氣候科學等領域的數位孿生與協同。預計將成為展會最受矚目的重頭戲。 https://www.youtube.com/live/ly2aznIb3zg?si=YJBqszlTkAmABj8- 影片來源: Computex Taipei 【5/19:14:00~15:00 高通CEO Cristiano】 主題方向:探討AI如何重塑手機、PC、車載系統等設備體驗,以及Edge AI在個人化與互動式生態系統中的角色。介紹Qualcomm在Edge AI晶片與5G整合上,如何加速從手機到車載的產業應用。針對即將到來的超薄筆電與混合裝置,分享Qualcomm在低功耗高效能平台佈局。 https://www.youtube.com/watch?v=EdrS3Zq3zFQ 影片來源: Computex...

馬斯克:這是世界上最聰明的AI,Grok4正式登場,xAI團隊正式發表全新升級的功能

在這個知識主宰命運的時代,這項創舉將徹底改寫未來 在人工智慧以驚人速度推進的今天,科技奇才 Elon Musk 再度站上全球舞台,發表劃時代的 AI 模型——Grok 4。在這場震撼全球的發表會上,他與 XAI 團隊 共同揭示了 Grok 4 的強大能力,象徵 AI 發展邁入前所未有的新紀元。 https://youtu.be/NINCGqIcfI8?si=OeGlochdiNnPO6eE 馬斯克直入主題:智慧型 AI 不再需要介紹 身為科技界最具辨識度的代表人物之一,馬斯克在發表會一開始便不假自我介紹,語氣堅定地宣告:「這是世界上最聰明的 AI。」他進一步補充:「我們將展示 Grok 4 如何辦到這一點。」 馬斯克指出,AI 的學習與推理速度已遠超人類,「這不只是模型的進化,更是智慧大爆炸的前兆。」 顛覆性能力一:全面超越人類學術水準 Grok 4 展現出跨領域學術實力,不僅能在...

韓國電影wonderland│留下一個不在人世間的他她,打造一個不在人世間的你

#打造一個不在人世間的你#留下一個不在人世間的他她 你會想訂購一個 wonderland 嗎? #Netflix#wonderland電影#원더랜드#韓國電影 由 #湯唯#秀智#朴寶劍#孔劉#鄭有美#崔宇植#鮑起靜 等人主演,主要講述在未來世界裡,人們透過AI、VR技術將已過世或病中的親人的身影、個性特徵、記憶等保存下來,再透過電話、視訊、或任何投影方式重現在你需要的時候。 這部電影2小時不到的時間就能迅速追完,據說這部片原本該在2021就上映了,但後來一些因素而延遲了,幸好今年韓國6/5也順利上映了,很高興 Netflix 也上架了,讓不在韓國的我們也能看到。 由於電影時數關係,3段主線、2段支線,並不能把故事好好說,情感好好舖,但沒關係,其他的橋段你可以自己在腦海補演一段,秀智因為男友朴寶劍生病中,而創造了另個他陪伴著她每一天,湯唯我猜測她是自己訂購的服務,擔心女兒跟媽媽而留下虛擬的自己,還有鄭有美為父母、崔宇植的父親生前為自己、成炳淑為了孫子訂購了服務。 他們都是為了什麼? 減少遺憾吧!我想。 畢竟使用 AI工具讓老照片動個3-5秒、跟chatgpt 4o 直接像朋友一樣聊天,已是成熟迅速隨時可用,再進階若是讓你的虛擬人變成你的已逝或不在身邊的親友呢? 我想很多人會想訂購的,包含我自己也是,但服務會留多久呢? 不確定,要看每個人當下的承受度。 如果停止傷心除了忘記或轉移注意力外還有這個方式的話,內心的苦痛很難被撫平的時候,與其天天傷心變成憂鬱,或許有時能夠短期利用這個方式少了些遺憾,也能讓傷口慢慢癒合。 桂志雄檢察官若有訂購這個服務就不用做惡夢啦! PS:如果只是來懷念或正途是可以,但拿來詐騙或作壞事就天下大亂了。 影片來源: Netflix https://www.youtube.com/watch?v=NFIRWIGxWl8

OpenAI 領投,Nvidia 助攻!機器人室友NEO Gamma 將走入千家萬戶,徹底改變你的生活!

2025/2/22 NEO Gamma 機器人公開發佈 你是否曾幻想過擁有一個貼心的機器人室友,幫你煮咖啡、打掃房間,甚至在你忙碌時陪你聊聊天?隨著人工智慧(AI)和機器人技術的飛速進步,這樣的場景正逐漸從科幻走向現實。今年,來自 1X Technologies 公司的新一代人形機器人 NEO Gamma 機器人亮相,引發了業界與消費者的熱議。這款被稱作「居家助手」的機器人有什麼獨到之處?機器人產業的最新趨勢如何?消費者又對此抱持怎樣的期待和疑慮呢?讓我們以輕鬆對話的方式,一起深入探討 NEO Gamma 的技術創新與市場發展走向。 https://twitter.com/1x_tech/status/1893012909082714299 科技趨勢:AI 加持下的人形機器人浪潮 說到近期機器人產業的發展,大勢所趨就是 人工智慧與人形機器人的結合。過去幾年,機器人從工廠車間走入更廣泛的場景:我們已經習慣了掃地機器人、送餐機器人等專用機器人,如今業界開始瞄準更具通用性的雙足人形機器人。特別是 2023-2024 年,被視為人形機器人的「突破元年」——多家科技巨頭和新創公司投入研發,使得技術與資金在此匯聚​ Omdia 的最新報告指出,受益於關鍵零部件(伺服馬達、減速器、感測器等)的進步和生成式 AI 熱潮帶動,人形機器人正迎來大幅成長,2024-2030 年的年複合增長率預計高達 83%​,簡單說,市場對這類機器人的興趣和需求正在爆發。 在這股浪潮中,各種 AI 技術...