Google Gemini 3.5 Flash 與 Omni Flash 全面升級|AI Agent、影片生成與智能搜尋新時代

1010 2026.05.22

Google Gemini 3.5 Flash 與 Omni Flash 全面升級:AI Agent、影片生成與智能搜尋正式進入新時代

Google I/O 2026 帶來一系列與人工智能相關的重大更新,當中最受注目的,必定包括 Gemini 3.5 Flash、Gemini Omni Flash、Gemini Spark、Google Flow、Antigravity 2.0,以及更深入搜尋、購物、影片創作和穿戴式裝置的 AI 功能。對香港用戶、內容創作者、品牌營銷團隊、開發者以及企業而言,這不只是一次普通的產品更新,而是代表 Google 正在將 AI 從「回答問題的工具」推進到「主動完成任務的智能代理」階段。

Gemini 3.5 Flash:更快、更適合 Agentic AI 工作流程

Gemini 3.5 Flash 是今次更新的核心之一。根據 Google I/O 2026 開發者重點,Gemini 3.5 Flash 主打速度、推理能力及實際 agentic workflow 應用,Google 亦表示它在多項基準上比上一代模型有明顯提升。 對一般用戶來說,這代表 Gemini app、Google Search AI Mode 及相關 AI 工具將能更快理解複雜問題,亦更適合處理長時間、多步驟任務。​

對香港市場而言,這類 AI model 升級尤其重要。香港用戶日常搜尋習慣本身已經混合中文、英文、廣東話、品牌名及產品型號,例如「Gemini 3.5 Flash 有咩新功能」、「Google AI 可以幫我做 presentation 嗎」、「AI agent 可以自動整理 email 嗎」。當 AI 模型理解能力提升,用戶不再需要輸入非常精準的關鍵字,都可以得到更貼近語境的答案。這亦意味品牌做 SEO 時,不能再只依賴單一關鍵字,而要同時處理 conversational search、FAQ、長尾查詢及實際使用場景。

Gemini Omni Flash:由文字、圖片、音訊、影片輸入到 AI 影片生成

另一個重點是 Gemini Omni Flash。Google 官方介紹 Gemini Omni 是一個將推理能力與創作能力結合的新模型家族,第一款推出的 Omni Flash 率先聚焦影片生成,支援用文字、圖片、音訊、影片等多種 input 建立高質素影片,並可透過對話方式進一步修改內容。 Google 亦表示 Gemini Omni Flash 已開始在 Gemini app、Google Flow 及 YouTube Shorts 等平台推出。​

對內容創作者和品牌而言,這是一個非常重要的訊號。過去 AI 影片生成常見問題包括畫面不連貫、角色不穩定、品牌元素難以控制、修改成本高等;而對話修飾的出現,代表用戶可以像同創作總監溝通一樣,逐步要求 AI 改鏡頭、改角色動作、加強情緒、調整背景,甚至針對影片中的某些細節作修正。這對需要大量 social video、短片廣告、YouTube Shorts、Reels、TikTok 內容的團隊,將大幅縮短製作週期。

同時,Gemini Omni 生成內容會加入 SynthID 等內容驗證技術,Google 亦正將相關驗證擴展到 Gemini app、Chrome 及 Search 等場景。對品牌安全、廣告透明度及 AI 內容標示而言,這會越來越重要。未來品牌不只要問「可不可以用 AI 生成內容」,更要問「生成內容如何驗證、如何標示、如何避免被誤用」。

Gemini Spark:24/7 Personal AI Agent 的雛形

Gemini Spark 可視為 Google 對「個人 AI Agent」的進一步布局。根據用戶提供的資料,Spark 主打 24/7 personal AI agent,能協助處理 email、study guides 及日常工作,並會先向特定用戶開放 beta。 這類工具的重點不只是回答問題,而是能夠持續理解你的任務、文件、電郵及工作背景,然後主動幫你整理、提醒、草擬甚至執行部分流程。

對香港上班族及中小企來說,AI Agent 的應用場景非常直接。例如每日整理 Gmail 重點、從 Calendar 抽出今日會議摘要、自動生成 follow-up email、整合客戶查詢、撰寫 proposal 初稿、將會議紀錄變成 action list 等。當這些功能逐步與 Google Workspace、Gmail、Docs、Calendar 及第三方工具整合,AI 將不再只是「搜尋答案」,而是變成一個可以協助完成工作的數碼助理。

Docs Live、Ask YouTube、Ask Maps:搜尋體驗走向對話化

今次更新亦提到 Docs Live、Ask YouTube 及 Ask Maps。這些功能代表 Google 正在將 conversational AI 由 Gemini app 延伸到文件、影片及地點搜尋。對用戶而言,未來查資料可能不再是打幾個 keyword,再逐條 link 打開,而是直接問:「幫我用這幾封 email 起草一份文件」、「這段 YouTube 影片講了甚麼重點」、「附近有沒有適合商務午餐的餐廳」。AI 會在不同平台中理解內容,再用自然語言回應。

Antigravity 2.0:開發者工作流程進入 Agent-first 階段

Google Antigravity 2.0 是另一個值得關注的更新。Google Cloud 及 I/O 開發者資訊提到,Antigravity 配合 Gemini 3.5 Flash,目標是幫助企業和開發者更快建立、部署和管理應用,並提升 development cycle 的效率。 用戶提供的資料亦提到 Antigravity 2.0 加入 Standalone Desktop App 和 CLI,可同時召喚多個 AI subagents 協作 coding。

這代表未來開發流程有機會由「人類逐行寫 code」逐步轉向「人類設計目標、AI agent 分工執行、再由人類審核」。例如一個 agent 負責 planning,一個負責 coding,一個負責 testing,一個負責 documentation。對企業 IT 團隊、startup、MarTech 團隊及 n8n automation 用戶而言,這類 agent-first 開發模式將大幅提升 prototype、internal tool、workflow automation 的產出速度。

Agentic Commerce:AI 搜尋、購物與付款流程重組

Agentic Commerce 亦是今次 Google AI 更新中的重要方向。根據你提供的內容,Google 正將 Search、Gemini、YouTube、Gmail 串連成跨平台 shopping flow,而 Universal Cart 會成為購物 hub,Agent Payments Protocol 則用於設定 AI agent 付款 guardrails 和可驗證交易記錄。 這意味未來用戶可能不只是搜尋產品,而是直接要求 AI 比較選項、整理優惠、加入購物車,甚至在用戶授權下完成購買步驟。

Project Aura:AI 眼鏡與下一代穿戴式搜尋

Project Aura 代表 Google 對 AI glasses 和 Android XR 生態的長線布局。Google 過往已展示 Gemini 如何與 Android XR glasses 結合,讓用戶透過相機和語音理解周圍環境、翻譯、導航、訊息回覆等。 根據你提供的資料,Project Aura 首批 audio glasses 預計會於今年秋季推出,之後亦會有 display glasses。

穿戴式 AI 的出現會進一步改變搜尋方式。用戶未來可能不會打字搜尋,而是望住一件產品、一間餐廳、一個路牌,直接問 AI:「這是甚麼?」、「附近有沒有更好的選擇?」、「這間店評價如何?」這會令 local SEO、地圖資料、品牌知識圖譜及即時內容變得更加重要。

總結:AI SEO 不再只是排名,而是成為 AI 答案的一部分

Google Gemini 3.5 Flash、Gemini Omni Flash、Spark、Flow、Antigravity 2.0、Agentic Commerce 及 Project Aura 的出現,反映 AI 正由工具層面進入生活、工作、搜尋、創作及交易流程。對香港品牌而言,未來 SEO 不只是爭取 Google 搜尋結果第一頁,而是要令內容能夠被 AI 理解、引用、比較和推薦。

立即親臨 1O1O AI Store。由專業 AI 專員提供現場指導,協助您由基本設定開始,逐步掌握 AI 助手在生活與工作中的實際應用。

👉 立即親臨 1O1O AI Store: https://bit.ly/4hHaWz3

Q&A Section|常見問題

Q1: Gemini 3.5 Flash 是甚麼?

Gemini 3.5 Flash 是 Google 最新一代 Gemini AI 模型之一,主打更快的回應速度、更強的推理能力,以及更適合處理多步驟任務。它已逐步成為 Gemini app、Google Search AI Mode 及 Antigravity 等工具的重要模型之一,特別適合用於內容生成、資料整理、程式開發、搜尋輔助及 AI agent 工作流程。

Q2: Gemini Omni Flash 有甚麼特別?

Gemini Omni Flash 是 Google 新一代多模態 AI 影片生成及編輯模型。它支援以文字、圖片、音訊及影片作為 input,生成或修改影片內容。最大特色是可以透過對話方式 refinement,例如要求 AI 改鏡頭、調整角色動作、修改視覺風格或優化影片節奏,對品牌短片、YouTube Shorts、社交媒體內容及廣告製作非常有用。

Q3: Gemini 3.5 Flash 同 Gemini Omni Flash 有甚麼分別?

Gemini 3.5 Flash 主要偏向文字理解、推理、搜尋、工作流程及 agentic AI 任務;而 Gemini Omni Flash 則更集中於多模態創作,特別是影片生成及影片編輯。簡單而言,Gemini 3.5 Flash 適合「思考及執行任務」,Gemini Omni Flash 則適合「生成及修改視覺內容」。

Q4: Google Flow 是甚麼?

Google Flow 是 Google 的 AI filmmaking 及影片創作工具,主要讓用戶用文字 prompt 生成影片,並進一步進行影片編輯。配合 Gemini Omni Flash 後,Flow 將更適合內容創作者、品牌營銷團隊及影片製作人,用於快速建立短片概念、廣告素材、社交媒體影片及故事板視覺。

Q5: SynthID 有甚麼作用?

SynthID 是 Google 用於 AI 內容標記及驗證的技術。當 Gemini Omni Flash 生成影片時,內容會嵌入 SynthID,協助平台及用戶識別 AI 生成內容。隨着 AI 影片越來越普及,SynthID 對內容透明度、品牌安全、廣告合規及防止假資訊擴散都會變得更加重要。

Q6: Gemini Spark 是 AI Agent 嗎?

是。Gemini Spark 可視為 Google 對 personal AI agent 的進一步布局,主打 24/7 協助用戶處理日常任務,例如整理 email、建立 study guides、安排工作重點及協助生產力流程。它不只是回答問題,而是朝向「持續理解背景並主動協助完成任務」的方向發展。

Q7: Antigravity 2.0 對開發者有甚麼幫助?

Antigravity 2.0 是 Google 的 agent-first development platform,目標是將 planning、coding、testing 及 debugging 等開發流程整合起來。它支援 desktop app、CLI 及多個 AI subagents 協作,讓開發者可以用更高效率建立應用、測試功能、修正錯誤及管理程式碼。

Q8: Agentic Commerce 會如何改變網上購物?

Agentic Commerce 代表 AI 將更深入參與購物流程。未來用戶可能不只是搜尋產品,而是直接要求 AI 比較規格、分析價錢、整理優惠、加入購物車,甚至在授權情況下完成付款。對電商品牌而言,產品頁需要更清晰、結構化及可信,包括價格、規格、評價、保養、配送、FAQ 及優惠條款。

Q9: Project Aura 是甚麼?

Project Aura 是 Google 在 AI glasses 及穿戴式 AI 方面的重要布局。它包括 audio glasses 及未來的 display glasses,配合 Gemini 後,用戶可透過語音及鏡頭理解周圍環境、查詢資訊、進行翻譯、導航或獲取即時建議。這將令 local SEO、Google Maps 資料、商戶評價及地點內容變得更加重要。

Author Avatar

Written by

1010
Share this post
Tags
Archive