电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

谷歌全新AI模型Gemini 3發(fā)布 推理能力實(shí)現(xiàn)重大突破

關(guān)鍵詞:
2025-11-19 07:57:25  每日經(jīng)濟(jì)新聞

當(dāng)?shù)貢r(shí)間11月18日,Alphabet旗下的谷歌正式發(fā)布了迄今為止最強(qiáng)大的人工智能模型Gemini 3,并在發(fā)布首日將其整合到谷歌搜索、Gemini應(yīng)用程序及多個(gè)開發(fā)者平臺(tái)中。這是谷歌首次在新模型發(fā)布當(dāng)天就將其應(yīng)用于搜索產(chǎn)品,顯示出公司加快AI技術(shù)商業(yè)化的決心。

Alphabet首席執(zhí)行官桑達(dá)爾·皮查伊表示,新AI模型將針對(duì)更復(fù)雜的問題提供更優(yōu)答案,用戶只需更少的提示即可獲得所需結(jié)果。此外,新模型在編程、應(yīng)用開發(fā)與圖像生成方面的能力也大幅增強(qiáng)。Gemini 3將被整合進(jìn)Gemini應(yīng)用、谷歌的AI搜索產(chǎn)品AI Mode和AI Overviews,以及其企業(yè)級(jí)產(chǎn)品。該模型自周二起向部分訂閱用戶開放,并將在未來幾周更大范圍上線。

此次發(fā)布距離谷歌推出Gemini 2.5僅八個(gè)月,距離Gemini 2.0上線也僅11個(gè)月。引爆生成式AI熱潮的OpenAI已于今年8月份發(fā)布GPT-5。皮查伊寫道:“令人驚嘆的是,僅僅兩年時(shí)間,AI已從單純處理文本和圖像,發(fā)展到能夠讀懂場(chǎng)景。從今天起,Gemini將在谷歌全系產(chǎn)品中全面鋪開?!?/p>

據(jù)谷歌披露的數(shù)據(jù),Gemini應(yīng)用目前月活躍用戶已達(dá)6.5億,而AI Overviews擁有20億月活用戶。OpenAI則在8月表示,ChatGPT周活躍用戶已突破7億。谷歌高管強(qiáng)調(diào),在衡量人工智能模型性能的幾個(gè)熱門行業(yè)排行榜上,Gemini 3處于領(lǐng)先地位。該模型在全球AI模型LMArena排行榜上以1501分的歷史最高分登頂,在衡量通用推理能力的Humanity"s Last Exam基準(zhǔn)測(cè)試中獲得37.5%的最高分,超越了此前由GPT-5 Pro保持的31.64%紀(jì)錄。該模型還在數(shù)學(xué)、多模態(tài)理解和事實(shí)準(zhǔn)確性等多個(gè)維度刷新了行業(yè)標(biāo)準(zhǔn)。

DeepMind的CEO Demis Hassabis表示,Gemini 3是世界上最好的多模態(tài)理解模型,也是公司迄今最強(qiáng)大的智能體和代碼生成模型。谷歌CEO Sundar Pichai在博客中稱其為“我們最智能的模型”,能夠“將任何想法變?yōu)楝F(xiàn)實(shí)”。

Gemini 3在推理能力上取得了顯著進(jìn)步,在多項(xiàng)學(xué)術(shù)級(jí)基準(zhǔn)測(cè)試中展現(xiàn)出博士水平的表現(xiàn)。該模型在GPQA Diamond測(cè)試中獲得91.9%的高分,在數(shù)學(xué)領(lǐng)域的MathArena Apex基準(zhǔn)測(cè)試中取得23.4%的新成績,在事實(shí)準(zhǔn)確性方面于SimpleQA Verified測(cè)試中達(dá)到72.1%的得分。在多模態(tài)推理方面,Gemini 3同樣表現(xiàn)出色,在MMMU-Pro測(cè)試中獲得81%的分?jǐn)?shù),在Video-MMMU測(cè)試中達(dá)到87.6%。這意味著該模型能夠高度可靠地處理科學(xué)和數(shù)學(xué)等廣泛領(lǐng)域的復(fù)雜問題。

谷歌產(chǎn)品負(fù)責(zé)人Tulsee Doshi表示:“在Gemini 3身上,我們看到了推理能力的巨大飛躍。它的響應(yīng)深度和細(xì)微程度是我們以前從未見過的?!背龢?biāo)準(zhǔn)版本外,谷歌還推出了Gemini 3 Deep Think增強(qiáng)推理模式,該模式在Humanity"s Last Exam測(cè)試中達(dá)到41.0%的成績,在GPQA Diamond測(cè)試中獲得93.8%的分?jǐn)?shù)。在ARC-AGI-2測(cè)試中,Deep Think模式創(chuàng)下了45.1%的前所未有成績,展示了其解決新穎挑戰(zhàn)的能力。谷歌表示,該模式正在接受額外的安全評(píng)估,將在未來幾周內(nèi)向Google AI Ultra訂閱用戶開放。

在代碼生成領(lǐng)域,Gemini 3被谷歌稱為“迄今構(gòu)建的最佳vibe coding和智能體編碼模型”。該模型在WebDev Arena排行榜上以1487分的高分登頂,在衡量模型通過終端操作計(jì)算機(jī)能力的Terminal-Bench 2.0測(cè)試中獲得54.2%的分?jǐn)?shù),在評(píng)估代碼智能體的SWE-bench Verified基準(zhǔn)測(cè)試中達(dá)到76.2%,遠(yuǎn)超Gemini 2.5 Pro的表現(xiàn)。開發(fā)者可以通過Google AI Studio、Vertex AI、Gemini CLI以及Cursor、GitHub、JetBrains、Manus和Replit等第三方平臺(tái)訪問Gemini 3。

谷歌同時(shí)推出了以智能體為先的全新開發(fā)平臺(tái)Google Antigravity,該平臺(tái)利用Gemini 3的高級(jí)推理、工具使用和智能體編碼能力,將AI輔助從開發(fā)者工具箱中的一個(gè)工具轉(zhuǎn)變?yōu)橹鲃?dòng)合作伙伴。DeepMind首席技術(shù)官Koray Kavukcuoglu表示:“智能體可以在你的編輯器、終端和瀏覽器之間工作,以最佳方式幫助你構(gòu)建應(yīng)用程序?!?/p>

Gemini 3保留了該系列模型從一開始就具備的跨模態(tài)信息綜合能力,能夠無縫處理文本、圖像、視頻、音頻和代碼等多種模態(tài)信息,并配備100萬token的上下文窗口。Hassabis舉例說,如果用戶想學(xué)習(xí)傳統(tǒng)的烹飪,Gemini 3可以破譯并翻譯不同語言的手寫食譜,制作成可分享的家庭食譜書。如果用戶想了解新主題,可以提供學(xué)術(shù)論文、長視頻講座或教程,Gemini 3能夠生成交互式閃卡、可視化或其他格式的內(nèi)容幫助用戶掌握材料。該模型甚至可以分析用戶匹克球比賽的視頻,識(shí)別改進(jìn)空間并生成整體動(dòng)作改善的訓(xùn)練計(jì)劃。

在智能體能力方面,Gemini 3在測(cè)試長期規(guī)劃能力的Vending-Bench 2排行榜上位居榜首。該模型能夠在整整一年的模擬運(yùn)營中保持一致的工具使用和決策能力,在不偏離任務(wù)的情況下實(shí)現(xiàn)更高回報(bào)。這意味著Gemini 3能夠通過結(jié)合更深入的推理與改進(jìn)的工具使用,代表用戶導(dǎo)航更復(fù)雜的多步驟工作流程,例如預(yù)訂本地服務(wù)或整理收件箱。

谷歌此次采取了積極的產(chǎn)品策略,在Gemini 3發(fā)布首日就將其整合到多個(gè)核心產(chǎn)品中。這是谷歌首次在新模型發(fā)布當(dāng)天就將其應(yīng)用于搜索產(chǎn)品,標(biāo)志著公司AI商業(yè)化戰(zhàn)略的重要轉(zhuǎn)變。在搜索方面,AI Mode現(xiàn)在使用Gemini 3來實(shí)現(xiàn)新的生成式用戶界面體驗(yàn),包括沉浸式視覺布局、交互式工具和模擬,所有這些都根據(jù)用戶查詢實(shí)時(shí)生成。在Gemini App中,所有用戶都可以使用Gemini 3,Google AI Pro和Ultra訂閱用戶還可以在AI Mode搜索中使用該模型。

在安全性方面,谷歌表示Gemini 3是其迄今最安全的模型,經(jīng)歷了谷歌AI模型史上最全面的安全評(píng)估。該模型顯示出更低的諂媚性、更強(qiáng)的提示注入抵抗力,以及通過網(wǎng)絡(luò)攻擊濫用的更好防護(hù)。除了根據(jù)其前沿安全框架進(jìn)行的內(nèi)部測(cè)試外,谷歌還與世界領(lǐng)先的領(lǐng)域?qū)<液献鬟M(jìn)行評(píng)估,向英國AISI等機(jī)構(gòu)提供早期訪問權(quán)限,并獲得了Apollo、Vaultis和Dreadnode等行業(yè)專家的獨(dú)立評(píng)估。

(責(zé)任編輯:zx0176)
關(guān)閉

南京環(huán)衛(wèi)大叔打造銀杏落葉打卡點(diǎn) 用落葉寫下浪漫!

南京環(huán)衛(wèi)大叔打造銀杏落葉打卡點(diǎn)2025-12-08 15:08:59

我這一身聚酯纖維派上用場(chǎng)了 冬季穿衣新趨勢(shì)

我這一身聚酯纖維派上用場(chǎng)了2025-12-08 15:08:31

羅永浩稱不排除重新做手機(jī) 若成功或重啟項(xiàng)目

羅永浩稱不排除重新做手機(jī)2025-12-08 15:07:01

黃日華宣布退圈 告別演藝生涯

黃日華宣布退圈2025-12-08 14:55:29

大馬能成美國挑戰(zhàn)中國稀土的突破口嗎?

大馬能成美國挑戰(zhàn)中國稀土的突破口嗎2025-12-08 15:00:03

美國給歐洲劃死線:2027年,接管北約大部分常規(guī)防務(wù)能力 美歐防務(wù)分歧加劇

美國給歐洲劃死線,2027年,接管北約大部分常規(guī)防務(wù)能力2025-12-08 15:02:22

商家故意不打包讓騎手干等,騎手干等十分鐘引發(fā)熱議

商家故意不打包讓騎手干等2025-12-08 15:00:23

女子偷路燈當(dāng)廢品賣全程被記錄

女子偷路燈當(dāng)廢品賣全程被記錄2025-12-08 15:04:29

日本重走邪路只會(huì)自取滅亡!

日本重走邪路只會(huì)自取滅亡2025-12-08 13:54:21

護(hù)士患癌請(qǐng)病假遭拒?衛(wèi)健委介入調(diào)查 事件細(xì)節(jié)待查清

護(hù)士患癌請(qǐng)病假遭拒,衛(wèi)健委介入調(diào)查2025-12-08 14:57:23

俄烏和談再陷僵局之際 普京特朗普密談無果

俄烏和談再陷僵局之際2025-12-08 13:43:12

羅永浩稱不排除重新做手機(jī) 若成功或重啟項(xiàng)目

羅永浩稱不排除重新做手機(jī)2025-12-08 15:07:01

央視曝光智駕神器灰色產(chǎn)業(yè)鏈 致命改裝背后的隱秘鏈條

央視曝光智駕神器灰色產(chǎn)業(yè)鏈2025-12-08 14:55:11

被中方晾了一個(gè)月后 德外長老實(shí)了 務(wù)實(shí)合作成主調(diào)

被中方晾了一個(gè)月后德外長老實(shí)了2025-12-08 14:01:30

特朗普國安戰(zhàn)略報(bào)告提及臺(tái)灣8次 措辭變化引關(guān)注

特朗普國安戰(zhàn)略報(bào)告提及臺(tái)灣8次2025-12-08 14:59:17

遼寧艦調(diào)頭北上有何深意 日本感受到壓力

遼寧艦調(diào)頭北上有何深意2025-12-08 13:49:14

斷流數(shù)十年 鄭州“母親河”源泉噴水!

斷流數(shù)十年 鄭州“母親河”源泉噴水2025-12-08 15:03:55

我這一身聚酯纖維派上用場(chǎng)了 冬季穿衣新趨勢(shì)

我這一身聚酯纖維派上用場(chǎng)了2025-12-08 15:08:31

高志凱:中國不許日本再搞軍國主義,不取決于高市支持率高低 堅(jiān)決遏制新法西斯勢(shì)力

高志凱,中國不許日本再搞軍國主義,不取決于高市支持率高低2025-12-08 14:59:47

曝日軍二戰(zhàn)曾引導(dǎo)美軍轟炸平民 塵封檔案揭露黑暗歷史

曝日軍二戰(zhàn)曾引導(dǎo)美軍轟炸平民2025-12-08 15:07:17

為何安理會(huì)五常近期密集“對(duì)表”!

為何安理會(huì)五常近期密集“對(duì)表”2025-12-08 14:16:21

普京訪問印度后 曝澤連斯基也要去 印方謹(jǐn)慎籌備

普京訪問印度后曝澤連斯基也要去2025-12-08 14:56:59

清華小伙回應(yīng)被白嫖家教費(fèi) 揭露慣犯真面目

清華小伙回應(yīng)被白嫖家教費(fèi)2025-12-08 14:55:52

以總理當(dāng)著德總理談猶太人大屠殺 歷史責(zé)任與現(xiàn)實(shí)合作

以總理當(dāng)著德總理談猶太人大屠殺2025-12-08 14:47:18

護(hù)身符核輻射超標(biāo)1686倍 旅客“護(hù)身符”含放射性釷-232

護(hù)身符核輻射超標(biāo)1686倍2025-12-08 14:57:47

上千名德國民眾集會(huì)抗議美國,援委內(nèi)瑞拉政府

上千名德國民眾集會(huì)抗議美國2025-12-08 13:52:44

南京環(huán)衛(wèi)大叔打造銀杏落葉打卡點(diǎn) 用落葉寫下浪漫!

南京環(huán)衛(wèi)大叔打造銀杏落葉打卡點(diǎn)2025-12-08 15:08:59

曝日軍引導(dǎo)美軍轟炸平民 塵封檔案揭露黑暗歷史

曝日軍引導(dǎo)美軍轟炸平民2025-12-08 14:48:19

日軍引導(dǎo)美軍轟炸平民,首次披露 塵封檔案揭露真相

日軍引導(dǎo)美軍轟炸平民,首次披露2025-12-08 14:42:19

王曼昱感受到中國力量 團(tuán)隊(duì)凝聚力鑄就勝利

王曼昱感受到中國力量2025-12-08 14:59:13

11通電話被掛 老師沖到學(xué)生家救人 緊急救援一氧化碳中毒

11通電話被掛老師沖到學(xué)生家救人2025-12-08 15:01:42

中央氣象臺(tái):新一波冷空氣又雙叒要來了 干燥模式持續(xù)

中央氣象臺(tái),新一波冷空氣又雙叒要來了2025-12-08 15:02:17

相關(guān)新聞