Gemini 3 模型的核心功能包含哪些方面？

Google 的 Gemini 3 模型相較於前一代 Gemini 2.5 Pro，在推理能力、代理能力、編碼性能及長脈絡視窗等多個關鍵指標上均有顯著提升。Gemini 3 Pro 作為該系列中首個發布且功能最強大的模型，旨在協助專業人士實現創意，在多個領域都具有廣泛的應用前景。

最先進的推理能力： Gemini 3 具備深度推理能力，能夠掌握前所未有的深度和細微差異。在複雜的科學知識測試（GPQA Diamond）中，獲得 91.9% 的高分，展現了博士級的推理能力。
世界領先的多模態理解： 能夠跨文字、圖像、影片、音訊，甚至是程式碼進行推理，並在多模態理解基準測試上創下新高。在複雜圖像推理基準 MMMU-Pro 上得分 81.0%，在影片理解基準 Video-MMMU 上得分 87.6%。
改進的代理式能力： 在代理編碼和長期代理任務上表現優異，能夠遵循指令，並有效使用工具。在衡量編碼代理能力的 SWE-bench Verified 中，得分 76.2%，大幅超越 Gemini 2.5 Pro 的 59.6%。
代理式編碼與 Vibe Coding： 擅長代理式工作流程和複雜的零樣本任務，例如在 Terminal-Bench 2.0 上得分 54.2%，高於 Gemini 2.5 Pro 的 32.6%。
長脈絡視窗： 支援 100 萬個詞元的輸入脈絡窗口。在長脈絡性能（MRCR v2, 128k 平均）上得分 77.0%，遠高於 Gemini 2.5 Pro 的 58.0%。

Gemini 3 的核心功能使其在軟體開發、企業與法律、多模態處理等領域具有廣泛的應用前景。它旨在幫助用戶實現學習、構建與規劃三大目標，例如解讀手寫食譜、打造互動性網頁 UI 和應用程式，以及協助規劃旅遊行程等。

總體而言，Gemini 3 在多個方面均取得了顯著突破，使其成為更強大、更智能的 AI 模型，有助於提升生產力並在快速變化的商業環境中保持競爭優勢。