Google I/O大會亮點-Veo3&flow│從AI 影片生成到AI導演,直接跳級分鏡電影敍事風格及音樂音效同步

從 Google I/O 到全球開放,解析 Veo 3 技術特色、應用潛力與產業衝擊

2025 年 5 月 20 日,Google 在年度開發者大會 Google I/O 上揭示了一場 AI 革命,核心主題圍繞著 “AI First Everything”。CEO Sundar Pichai 宣示,AI 將成為 Google 全產品線的基礎架構。整場大會中,多項旗艦級技術同步亮相:

Veo 3 正式登場:作為 AI 創作生態的核心影片引擎,融合影像與音訊生成,成為全場矚目焦點。

Gemini 2.5 Pro 與 Flash:具備更快推理與語境記憶能力,強化 AI 生產力。

Gemini Live(前稱 Project Astra):整合視覺、語音與網頁互動的即時對話助理。

Agent Mode(Project Mariner):讓 AI 理解使用者目標,自主搜尋與執行任務。

Imagen 4 圖像生成器:提供更高解析度與細節掌控的圖像創作能力。

Flow 影片創作工具:支援分鏡、敘事節奏與電影級風格設計。

Veo 最初由 DeepMind 團隊主導開發,是 Google 旗下的文字轉影片(Text-to-Video)AI 模型,歷經三代發展。Veo 3 於 I/O 大會中隆重亮相,被定位為 “創作者的虛擬導演”。技術上,它具備下列創新特點:

  • 支援 1080p/60fps 的高畫質影片輸出
  • AI 同步音訊生成:能為場景自動生成環境音與配樂。
  • 多鏡頭場景控制:可依據文字提示產出具有連續敘事邏輯的段落。
  • 風格模擬能力:支援動畫、寫實、黏土、漫畫等風格切換。
  • 角色一致性維持:讓角色在多個鏡頭中外觀與動作更連貫(目前仍是業界難題)。
  • 多模態輸入理解:可搭配照片、影片片段、草稿分鏡進行生成。

專為創作者打造:Flow 讓使用者像操作積木一樣,透過拖曳分鏡元件(SceneBuilder)、輸入文字提示與上下文,來決定場景走向與鏡頭轉場方式。

對接 Veo 3 與 Imagen 4:Flow 運作時會同時串接 Veo 3(負責影片動態與音訊生成)與 Imagen 4(負責影像細節與品質),全方位打造高畫質、有節奏感的短片

攝影機控制 (Camera Controls):演講中示範如何設定鏡頭運鏡方式,包括移動軌跡、推拉鏡頭(dolly)、平移(pan)、及變焦(zoom),讓影片具備「電影級」運鏡感 。

連續鏡頭擴展 (Scenebuilder):可以讓場景不中斷接續,比如從一本書的近拍轉到角色翻頁。使用者可依語意控制鏡位與切換,Flow 自動生成每段鏡頭與敘事節奏

Flow TV 展示 (Flow TV):演講中提及可瀏覽由社群創作的範例影片,並查看使用的 prompt 與鏡頭設定,強調 Flow 具學習借鑒功能 。

同步聲音 (Synchronized Audio):與 Veo 3 合作,Flow 可以產生對白、環境音與背景音樂,且聲音會自動配合嘴型、動作與氛圍,如雨聲、風聲、腳步聲等 。

情境語調調整:可在每段鏡頭中設定聲音情緒,例如悲傷、興奮或平緩,Flow 自動調整配樂與語調節奏,讓短片具備情緒張力 。

素材管理 (Asset Management):Flow 提供管理文字提示、圖像參考與素材片段的功能,讓創作者更系統化地編排專案內容 。

VEO3與Flow 時間軸:1:28:00-1:37:30

雖然 Veo 3 在 5 月 I/O 大會亮相後即備受關注,但正式開放使用則分階段進行。Google 採取與 Gemini App 整合的策略,僅開放給 AI ProAI Ultra 訂閱用戶使用,並率先於北美、歐洲 150 多國推出。

在台灣,Google 官方於宣布於 2025 年 7 月 3 日 開放生成,Veo 3 透過 Gemini App 提供給付費用戶試用,使用者只需開啟 Gemini App,進入「照片轉影片」功能頁面,即可輸入描述文字或上傳靜態圖,生成一段約 8 秒、具備背景音效的影片。

Latest

馬斯克:這是世界上最聰明的AI,Grok4正式登場,xAI團隊正式發表全新升級的功能

在這個知識主宰命運的時代,這項創舉將徹底改寫未來 在人工智慧以驚人速度推進的今天,科技奇才 Elon Musk 再度站上全球舞台,發表劃時代的 AI 模型——Grok 4。在這場震撼全球的發表會上,他與 XAI 團隊 共同揭示了 Grok 4 的強大能力,象徵 AI 發展邁入前所未有的新紀元。 https://youtu.be/NINCGqIcfI8?si=OeGlochdiNnPO6eE 馬斯克直入主題:智慧型 AI 不再需要介紹 身為科技界最具辨識度的代表人物之一,馬斯克在發表會一開始便不假自我介紹,語氣堅定地宣告:「這是世界上最聰明的 AI。」他進一步補充:「我們將展示 Grok 4 如何辦到這一點。」 馬斯克指出,AI 的學習與推理速度已遠超人類,「這不只是模型的進化,更是智慧大爆炸的前兆。」 顛覆性能力一:全面超越人類學術水準 Grok 4 展現出跨領域學術實力,不僅能在...

《美男惡徒-闇夜中綻放的邪惡之戀》雙平台正式上市

歷經漫長等待,女性向戀愛模擬手機遊戲《美男惡徒-闇夜中綻放的邪惡之戀》今(8)正式於雙平台同步推出。玩家將化身為一名在命運牽引下踏入禁忌之地的郵差,與九位充滿危險魅力的「惡徒」展開一段段致命又浪漫的戀曲。 《美男惡徒》開服豪禮同步登場 為了回饋玩家支持,官方宣布事前登錄獎勵將全服發送!並推出多項開服限定活動與豐富好禮,邀請玩家共同踏入這場危險卻令人著迷的黑暗戀愛物語。 開服好禮搶先看: 開服紀念轉蛋限時登場,機會獲得角色限定獎勵 劇情活動〈闇夜中綻放的邪惡之戀 Part.1〉同步開放,揭開禁忌戀情序章  綁定 iSWEETY LINE 官方帳號 即可獲得: ‧ 金黃色調的成熟妝容一套 ‧ 鑽石 ×100 《美男惡徒》首度參展漫博25 限定儲值活動搶先看! 為慶祝《美男惡徒》首次參加 #漫博25 台北國際漫畫博覽會,特別推出限時儲值活動,回饋所有支持《美男惡徒》的玩家。只在展期限定開跑,心動不如行動,趕緊把握機會入手豐富回饋! 活動時間|2025年7月23日(三)10:00 ~ 7月28日(一)21:00 注意事項: 遊戲內儲值與網頁平台儲值之面額與回饋方式大不相同,請務必確認您的儲值平台,避免影響權益。 更多關於《美男惡徒》的遊戲特色、劇情介紹與後續開服活動將陸續公開,敬請玩家鎖定官方粉絲團與社群平台,搶先掌握最新動態! Google play商店:https://play.google.com/store/apps/details?id=com.isweety.ikemenshc Apple Store商店:https://apps.apple.com/tw/app/id6744320961 事前登錄網站: https://www.ikemenvil.com 官方粉絲團:https://www.facebook.com/Ikemenvil iSWEETY IG:https://www.instagram.com/isweetyig

影片生成神器Sora開放,OpenAI重大發布付費方案與9大核心功能,湧入數億流量

在年初就發布的Sora,讓全世界的影視創作者既期待又害怕,同時也讓全世界的影片生成工具光速的發展,就在大家都在猜測可能Sora不一定會開放使用的時候,OpenAI又公布即將有連續12天重磅更新發表,身為目前AI技術的領軍者,大家都在期待會有什麼新科技讓全球的科技為之振奮呢! 2024/12/5,OpenAI 在X 上發布,隔日即將展開12天(工作天)的直播 https://twitter.com/OpenAI/status/1864328928267259941 2024/12/6 開啟第一天直播, OpenAI 的 chatgpt 01 pro mode 正式全面開放 2024/12/7 OpenAI 啟動一個新模型--強化學習微調 Reinforcement Fine-Tuning ,這是一種新的模型客製化技術,使組織能夠為編碼、科學研究或金融等領域的特定、複雜任務建立專家模型,強化學習微調研究計劃擴大對研究人員、大學和企業的 alpha 訪問。 2024/12/10 想不到在第3個工作天就迎來了:OpenAI影片生成新里程碑 - 12Days of...

生成式AI的應用大戰:如何利用它斜槓,為職場加分

就如同這篇文章的圖片,都是透過想像加上文字生成的圖片,AI已經大大幫人類加速許多進度,不會畫畫,不會做音樂,不會演講,不懂法律,未來這些都不要緊了,哦!或許該說,現在,Right Now 已經開始了。 大戰己經開打了,你還在等什麼呢? 生成式AI的崛起:科技浪潮中的新機遇 生成式AI(Generative AI)在近幾年的技術突破下,已成為全球科技產業的焦點。從生成文本的ChatGPT,到能畫出細緻圖像的DALL-E,以及能作曲、影像處理的其他工具如SUNO、Runway、Kling等,生成式AI正快速滲透到我們的生活與工作中。這些技術的進步不僅為科技公司帶來巨大商機,也為個人開創了無限的可能性。 生成式AI(Generative AI)正在以前所未有的速度重塑科技產業。馬斯克(Elon Musk)曾表示:"人工智能是我們時代最深遠的技術革命之一。" 而OpenAI的創辦人Sam Altman則進一步強調,"生成式AI將讓人類無需為重複性工作而苦惱,從而專注於更具創造性的事物。" 生成式AI的核心優勢在於它能透過大規模數據的訓練,模仿並創造出接近人類水平的內容。不論是企業內部的文檔整理,還是外部市場行銷的素材生成,它都能顯著提高效率。或許未來只有你想像不到事情,沒有AI做不到的事情。 斜槓時代的利器:生成式AI如何幫助多重職業發展 隨著數位經濟的崛起,斜槓(Slash Career)成為越來越多人追求的生活方式。而生成式AI的出現,為實現多重職業帶來了高效的工具。例如,對於同時身兼自由撰稿人和線上課程講師的人來說,AI可以協助快速生成文章大綱、課程內容,甚至完成簡報設計。 文案撰寫與內容創作 生成式AI在文案撰寫方面的應用非常廣泛。以ChatGPT為例,它可以根據輸入的主題快速生成結構清晰、語句通順的文章。不論是博客、廣告標語還是社交媒體內容,它都能快速提供素材。這不僅節省時間,也讓文字創作者可以專注於細緻化的修改與創意發揮。 跨領域技能提升 透過生成式AI,學習新技能變得更加容易。例如,設計師可以使用生成式圖像工具創建視覺素材,即便他們對設計軟體不熟悉;音樂愛好者則可利用AI工具生成旋律或編曲,快速上手音樂創作,例如,YouTube創作者使用Runway ML製作高品質的視頻特效,而對設計不熟悉的創業者則可以通過Canva的AI工具快速設計品牌素材。 創業與副業的推進 對於有創業夢想的人,生成式AI可以在啟動階段提供多種支持,從品牌命名、商業計劃書撰寫到產品包裝設計,皆能高效完成。此外,透過生成式AI創建的內容,還能開啟新的副業模式,例如販售AI生成的圖片、文本,甚至開設課程教授這類技術。 透過AI生成作品讓素材上手速度飛快的提升,有助於個人在不同領域發展更多的收入來源。例如,使用創意生成的圖片、影片,成立專屬自媒體頻導流,例如小紅書的貓太乙,以貓咪為主角,讓貓咪變成廚師,製作各式料理。 https://youtube.com/shorts/nlZjffAZL0Q?si=_DhCw40nmYPSKPAh 在職場中脫穎而出:生成式AI如何提升你的專業競爭力 職場競爭日益激烈,如何在眾多候選人中脫穎而出,是許多人關心的問題。生成式AI的應用不僅能讓你在工作中如虎添翼,還能成為你的職業發展加分項。 提高效率與準確性 職場中常見的任務,如撰寫報告、資料分析、製作簡報等,生成式AI都能大幅提高效率。例如,使用OpenAI的工具,可以快速生成數據摘要和分析結論,而設計類AI工具則可協助快速完成視覺化內容的創建。當你能在短時間內完成高質量的工作,自然會受到上司和同事的青睞。 強化創意與解決問題的能力 生成式AI能激發新的創意,幫助你在困難的情境中找到解決方案。例如,在產品開發會議中,AI可以根據簡單的描述生成多種設計草案,供團隊討論。這不僅節省了人力,也讓創意迸發變得更加高效。 職場技能的數位化轉型 隨著職場數位化轉型的推進,掌握生成式AI技術已成為一項重要的技能。例如,熟悉Python或其他程式語言,能幫助你更深入地自訂生成式AI工具,提高工作效率。此外,許多公司正在尋找能將AI應用於業務流程的專業人士,如果你能主動學習相關技術,將能大幅提高競爭力。 未來展望:生成式AI將如何改變職場生態 生成式AI的應用已逐漸改變職場生態。未來,它將不僅是工具,還可能成為許多行業的核心技術。以下是一些值得關注的發展趨勢: 自動化工作的延伸 隨著生成式AI能力的進一步提升,許多重複性高的工作將逐漸被自動化。例如,法律行業的合同草擬、醫療行業的病歷記錄整理,都能交由AI完成,讓專業人員專注於更高價值的工作。 創意行業的重塑 雖然生成式AI在創意產業中引起了一些擔憂,但更多人認為它是創意的放大器。例如,廣告公司可以利用AI生成多種視覺與文字素材,快速進行A/B測試;電影與遊戲行業則可透過AI生成角色設計或劇本草案,加速創作流程。 職場文化的轉型 隨著生成式AI的普及,團隊協作方式也將發生變化。例如,AI可以作為虛擬助手,協助團隊完成會議紀錄、任務分配等繁瑣工作。這將釋放更多時間,用於戰略規劃與創意討論。此外,員工對技術的接受度與學習能力將成為衡量人才的重要指標。