Gemini 3 模型的核心功能包含哪些方面?
Answer
Gemini 3 模型的核心功能
Google 的 Gemini 3 模型相較於前一代 Gemini 2.5 Pro,在推理能力、代理能力、編碼性能及長脈絡視窗等多個關鍵指標上均有顯著提升。Gemini 3 Pro 作為該系列中首個發布且功能最強大的模型,旨在協助專業人士實現創意,在多個領域都具有廣泛的應用前景。
核心功能
- 最先進的推理能力: Gemini 3 具備深度推理能力,能夠掌握前所未有的深度和細微差異。在複雜的科學知識測試(GPQA Diamond)中,獲得 91.9% 的高分,展現了博士級的推理能力。
- 世界領先的多模態理解: 能夠跨文字、圖像、影片、音訊,甚至是程式碼進行推理,並在多模態理解基準測試上創下新高。在複雜圖像推理基準 MMMU-Pro 上得分 81.0%,在影片理解基準 Video-MMMU 上得分 87.6%。
- 改進的代理式能力: 在代理編碼和長期代理任務上表現優異,能夠遵循指令,並有效使用工具。在衡量編碼代理能力的 SWE-bench Verified 中,得分 76.2%,大幅超越 Gemini 2.5 Pro 的 59.6%。
- 代理式編碼與 Vibe Coding: 擅長代理式工作流程和複雜的零樣本任務,例如在 Terminal-Bench 2.0 上得分 54.2%,高於 Gemini 2.5 Pro 的 32.6%。
- 長脈絡視窗: 支援 100 萬個詞元的輸入脈絡窗口。在長脈絡性能(MRCR v2, 128k 平均)上得分 77.0%,遠高於 Gemini 2.5 Pro 的 58.0%。
應用場景
Gemini 3 的核心功能使其在軟體開發、企業與法律、多模態處理等領域具有廣泛的應用前景。它旨在幫助用戶實現學習、構建與規劃三大目標,例如解讀手寫食譜、打造互動性網頁 UI 和應用程式,以及協助規劃旅遊行程等。
總體而言,Gemini 3 在多個方面均取得了顯著突破,使其成為更強大、更智能的 AI 模型,有助於提升生產力並在快速變化的商業環境中保持競爭優勢。