Google 在11月發表 Gemini 3 Pro 後,於12月17日再推出全新模型「Gemini 3 Flash」,主打高速回應與高成本效益,鎖定日常使用與大規模部署需求。Google 表示,Gemini 3 Flash 的目標並非犧牲能力換取速度,而是打破過去「快但不聰明、聰明卻很慢」的取捨,讓效能與效率能同時兼顧。

10
Google 在11月發表 Gemini 3 Pro 後,於12月17日再推出全新模型「Gemini 3 Flash」。(圖/翻攝自Google台灣官方部落格)

從定位來看,Gemini 3 Flash 承襲 Flash 系列一貫的輕快特性,卻以 Gemini 3 Pro 為基礎,完整支援多模態理解、程式碼生成與代理(Agent)能力。在成本僅約 Gemini 3 Pro 四分之一的前提下,Google 將其定位為具備「實用推理能力」的核心主力模型,而非單純的簡化版本。

在多項效能評測中,Gemini 3 Flash 表現亮眼。根據第三方機構 Artificial Analysis 的資料,該模型在速度上比前一代 Gemini 2.5 Pro 快約3倍,同時在完成日常任務時,平均所需的權杖數量減少約30%,顯示效率明顯提升。推理能力方面,Gemini 3 Flash 在 GPQA Diamond 測試中取得 90.4%,在「Humanity’s Last Exam(無工具)」測試中達到 33.7%,已具備與大型前沿模型競爭的實力。多模態綜合指標 MMMU Pro 也拿下 81.2% 高分,與 Gemini 3 Pro 幾乎並駕齊驅。

在應用層面,Gemini 3 Flash 已透過 Gemini 應用程式與 Google 搜尋的「AI 模式」於全球部署,並正式取代 Gemini 2.5 Flash,成為所有使用者可免費使用的預設模型。「快捷模式」與「思考型模式」皆以 Gemini 3 Flash 為核心,僅在高難度數學或複雜程式碼生成需求時,才需切換至 Pro 模式。實際應用上,從學習輔助、語音理解到商務文件分析、行銷內容與網頁程式碼生成,都能快速完成。

10
Google 也強化成本節省機制,包括內容快取功能。(圖/示意圖)

對開發者與企業而言,Gemini 3 Flash 同步上架於 Gemini API、Vertex AI、Gemini CLI 與 Android Studio,並針對代理型應用與反覆式開發進行優化。在軟體開發自動化指標 SWE-bench Verified 中,Gemini 3 Flash 以 78% 的成績超越 Gemini 3 Pro,顯示在速度與實務開發效能上的優勢。

此外,Google 也強化成本節省機制,包括內容快取功能,在特定條件下可降低高達 90% 的成本;批次 API 則提供 50% 的價格折扣,並支援更高的速率限制,滿足企業級與非同步處理需求。

整體而言,Google 將 Gemini 3 Pro 視為最高效能旗艦,而 Gemini 3 Flash 則成為日常使用與大規模部署的核心支柱。Gemini 副總裁 Josh Woodward 指出,過去 AI 發展長期受限於速度與效能的二選一,而 Gemini 3 Flash 的推出,正是為了終結這種折衷,為使用者與企業帶來兼具速度與智慧的全新選擇。