Google執行長皮查伊在Google開發者大會上,一口氣端出大量新功能。美聯社
Google年度開發者大會Google I/O台灣時間20日凌晨登場,一口氣端出大量新功能,除了全面翻新旗下AI生態系、正式發表全新一代模型「Gemini 3.5」外,個人的數位秘書「Gemini Spark」、能用任意素材生成影片的「Gemini Omni」也同步登場。《太報》為您整理此次Gemini升級5大亮點,精準掌握AI趨勢。
亮點一:Gemini 3.5 Flash正式登場
Google此次發布會最大亮點為全新「Gemini 3.5」系列模型,率先登場的Gemini 3.5 Flash主打「低成本、高速度」的長時序任務與程式開發能力,Google對其定位為「結合前沿智慧與行動能力」的模型,主打程式碼撰寫與自動化任務。
Google執行長皮查伊(Sundar Pichai)指出,Gemini 3.5 Flash在多項代理式與程式碼基準測試中,效能都超越了前一代的進階版Gemini 3.1 Pro,特別是生成程式碼方面進步尤其明顯;在速度上Gemini 3.5 Flash同樣獨占鰲頭,若以每秒輸出token數計算,速度是其他前沿模型的4倍。
亮點二:24小時個人AI助理「Gemini Spark」登場
此次發布會最受矚目的另一大亮點,就屬Google最新發表的代理式平台「Gemini Spark」。皮查伊表示,Gemini Spark是「你在Gemini應用程式中的個人AI代理,協助你處理數位生活中的大小事,在你的指示下代你採取行動」。能串接 Gmail、Sheets 等多項 Google 原生服務,執行複雜的跨 App 指令,且即使用戶闔上筆電螢幕或關掉手機,Gemini Spark仍會在背景持續處理任務。
在官方展示中,使用者可以請Google每月自動掃描信用卡帳單、揪出隱藏費用或新增的訂閱項目;或是彙整 Gmail 與文件中的會議記錄、起草進度報告。Gemini Spark本週起將率先向受信任的測試者開放,Beta版則於下週起陸續開放美國的Google AI Ultra訂閱用戶使用。
亮點三:Gemini Omni讓AI創作影片再進化
Google此次還同步發布最新影片生成模型Gemini Omni,不僅能接收文字、圖片、影片、音訊等各種類型的素材生成影片,還可透過對話方式直接剪輯修改。Google舉例,用戶可拿一段自己拍的影片,直接要求Omni更改畫面視角、調整動作,或是加入新的角色與物件。Google主管聲稱,由於Omni理解重力、動能、流體力學等物理規律,產出的影片會比其他模型更逼真。
亮點四:Gemini介面大改版 搜尋框原生支援「多模態輸入」
Google 導入了名為「Neural Expressive」的全新設計介面。翻攝自Google
在使用者體驗方面,Google導入名為「Neural Expressive」的全新設計介面,除了優化動畫流暢度、色彩與字體排版,還重新設計麥克風位置以利啟動與音對話。此外,Google搜尋的AI模式也全面升級,新版搜尋框除了提供AI生成的搜尋建議,更原生支援「多模態搜尋」,使用者現在起可直接上傳圖片或影片查詢,Gemini也會根據查詢結果,即時產出對應的互動表格、圖表或影片。
亮點五:智慧助理、通用購物車 其他重點更新一次看
除了上述幾項重大更新,Google這次還公布多項更新,包括每日摘要、通用購物車和獨立的桌面應用程式「Antigravity 2.0」等。
此次更新導入「每日摘要」功能,允許Gemini讀取並整合用戶信箱、行事曆與待辦事項,並同步排定優先順序、組織內容,再彙整成一份適合快速瀏覽的晨間摘要,讓用戶迅速掌握當日行程。
除此之外,Google也推出一項名為「Universal Cart(通用購物車)」的新功能,未來用戶在和Gemini對話、看YouTube、甚至查看Gmail信件時看到想買的商品,就能直接將商品加入購物車,隨後Gemini就會自動在背景運作,24小時追蹤價格波動、尋找特價,甚至當用戶把不同商家的電腦零件加入購物車時,還能主動警告哪些零件不相容,並推薦合適的替代選擇。
Google此次大會也提及與三星和眼鏡品牌Warby Parker、Gentle Monster合作的智慧眼鏡發布時程,該款智慧眼鏡將分成提供語音協助的音訊眼鏡,以及顯示資訊的顯示眼鏡兩種,其中音訊眼鏡將於今年秋季率先推出,預計可為用戶提供導航、即時翻譯等功能。
針對訂閱方案,Google此次也宣布做出調整,最高階的AI Ultra方案月費將從250美元降到200美元,另外推出100美元、主打開發者與工作用戶的Ultra版本。
除了功能大升級之外,高階訂閱方案同步降價。翻攝自Google
AI競賽Google打出規模牌押注代理式AI 便利與隱私界線成最大課題
包括OpenAI、Anthropic 在內的 AI 業者,近來皆積極強化模型的工具操作與長時間推理能力,Google 此次更新顯示其持續押注「代理式 AI」方向。從會主動辦事的Gemini Spark、跨平台的通用購物車,到放進搜尋框的AI代理,Google這次大會的主軸相當明確,即讓Gemini從「你問它答」的工具,轉型為「替你採取行動的代理」。面對同樣朝代理式AI發力、且正準備IPO的OpenAI與Anthropic,Google則以龐大的消費者基礎迎戰。
皮查伊指出,Gemini應用程式月活躍用戶已突破9億,較去年同期的約4億倍增,當這9億用戶背後串接的是Gmail、YouTube、Chrome與搜尋構成的生態系,Google形同將最難以複製的「規模」本身,轉變成這場AI競賽的護城河。值得關注的是,當AI被授權代為處理郵件、金錢與購物,如何拿捏便利與隱私之間的平衡,恐怕也將是用戶接下來必須面對的課題。