电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

新聞

DeepSeek為何堅持中文思考 漢字信息密度更高

關(guān)鍵詞:
2025-12-04 14:32:17  機器之心Pro

DeepSeek為何堅持中文思考 漢字信息密度更高!前天,DeepSeek 發(fā)布了兩個新模型,分別是 DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。這兩個版本在推理能力上有了顯著提升,DeepSeek-V3.2 版本能夠與 GPT-5 相抗衡,而 Speciale 版本結(jié)合了長思考和定理證明能力,表現(xiàn)可媲美 Gemini-3.0-Pro。有讀者評論說這個模型應(yīng)該叫 V4 而不是 V3.2。

DeepSeek為何堅持中文思考

海外研究者也迅速使用了 DeepSeek 的新版本,他們注意到 DeepSeek 推理速度顯著提升,但同時也遇到了困惑:即使用英文詢問,模型在思考過程中還是會切換到中文。這讓海外用戶感到不解:明明沒有用中文提問,為什么模型會用中文思考?難道用中文推理更好更快?

DeepSeek為何堅持中文思考 漢字信息密度更高

評論區(qū)有兩種不同的觀點,大部分評論認為漢字的信息密度更高。亞馬遜的研究者也認同這一觀點,表示表達相同的文本含義時,中文所需的字符量明顯更少。如果大模型的理解與語義壓縮相關(guān),那么中文在壓縮方面比英文更有效率,這可能是“中文更省 token”的原因。

DeepSeek為何堅持中文思考 漢字信息密度更高

具有多語言能力的大模型如果只采用英語思考的模式往往會導(dǎo)致一些效率問題。不光是中文,采用其他非英語的語言進行推理確實能夠有更好的表現(xiàn)。微軟的一篇論文《EfficientXLang: Towards Improving Token Efficiency Through Cross-Lingual Reasoning》發(fā)現(xiàn),使用非英語語言進行推理不僅減少了 Token 消耗,還能保持準確性。即使將推理軌跡翻譯回英語,這種優(yōu)勢依然存在,表明這種變化源于推理行為的實質(zhì)性轉(zhuǎn)變,而非僅僅是表層的語言效應(yīng)。

DeepSeek為何堅持中文思考 漢字信息密度更高

該論文評估了三個最先進的開源推理模型:DeepSeek R1、Qwen 2.5 (32B) 和 Qwen 3 (235B-A22B),問題以英語呈現(xiàn),但模型被明確指示以七種目標語言中的一種執(zhí)行其推理步驟。最終答案必須以英語提供,以確保評估的一致性。實驗結(jié)果顯示,與英語相比,使用非英語語言進行推理始終能實現(xiàn) 20-40% 的顯著令牌降低,而且通常不影響準確性。DeepSeek R1 的 token 減少量從 14.1%(俄語)到 29.9%(西班牙語)不等,而 Qwen 3 則表現(xiàn)出更顯著的節(jié)省,韓語的減少量高達 73%。這些效率提升直接轉(zhuǎn)化為推理成本降低、延遲更低和計算資源需求降低。

DeepSeek為何堅持中文思考 漢字信息密度更高

馬里蘭大學(xué)和微軟的研究論文《One ruler to measure them all: Benchmarking multilingual long-context language models》提出了包含 26 種語言的多語言基準 OneRuler,用于評估大型語言模型(LLM)在長達 128K 令牌的長上下文理解能力。研究者們通過編寫英語指令并將其翻譯成另外 25 種語言構(gòu)建了 OneRuler。實驗表明,隨著上下文長度從 8K 增加到 128K token,低資源語言與高資源語言之間的性能差距日益擴大。令人驚訝的是,英語并不是長上下文任務(wù)中表現(xiàn)最好的語言(在 26 種語言中排名第 6),而波蘭語位居榜首。在指令和上下文語言不一致的跨語言場景中,根據(jù)指令語言的不同,性能波動幅度可達 20%。

DeepSeek為何堅持中文思考 漢字信息密度更高

既然中英文都不是具有最佳大模型性能的語言,那大模型選擇思考語言的方式并不是完全以效率為先。評論區(qū)的第二種觀點認為訓(xùn)練數(shù)據(jù)中包含更多中文內(nèi)容更為合理。國產(chǎn)大模型采用更多中文訓(xùn)練語料,其思考過程出現(xiàn)中文是正常現(xiàn)象。類似的情況也出現(xiàn)在 AI 編程工具 Cursor 發(fā)布的新版本 2.0 核心模型「Composer-1」上,因為其思考過程完全由中文構(gòu)成。

DeepSeek為何堅持中文思考 漢字信息密度更高

今年 1 月份也有類似的事情發(fā)生,網(wǎng)友發(fā)現(xiàn)來自 OpenAI 的 o1-pro 模型也會隨機出現(xiàn)中文思考過程?;蛟S這就是人類語言的魅力,不同的語言有不同的特性,在大模型中總會有各種奇怪的事情發(fā)生。大模型說中文的事情越來越多,中文訓(xùn)練語料也越來越豐富。

DeepSeek為何堅持中文思考 漢字信息密度更高

DeepSeek為何堅持中文思考 漢字信息密度更高

(責任編輯:0882)
關(guān)閉

韓特檢組尋求法院判金建希15年 涉嫌多宗罪名

韓特檢組尋求法院判金建希15年2025-12-04 14:30:51

部分門店將老國標電動車轉(zhuǎn)二手賣 潛藏安全與法律風險

部分門店將老國標電動車轉(zhuǎn)二手賣2025-12-04 14:30:35

情侶婚前先后墜樓身亡雙方家屬回應(yīng) 賠償爭議引發(fā)熱議

情侶婚前先后墜樓身亡雙方家屬回應(yīng)2025-12-04 14:17:56

樂視網(wǎng)負債238億擬花1.8億炒股 持續(xù)虧損下的投資嘗試

樂視網(wǎng)負債238億擬花1,8億炒股2025-12-04 14:26:01

新國標“小電驢”長啥樣?瘦了、貴了 新車數(shù)量少選擇有限

新國標小電驢長啥樣,瘦了,貴了2025-12-04 14:22:32

韓特檢組尋求法院判金建希15年 涉嫌多宗罪名

韓特檢組尋求法院判金建希15年2025-12-04 14:30:51

被捕涉詐中國公民被分批次遣返!

被捕涉詐中國公民被分批次遣返2025-12-04 14:18:22

鈞正平:誰在為日本軍國主義“招魂” 復(fù)活的幽靈再現(xiàn)

鈞正平,誰在為日本軍國主義招魂2025-12-04 13:10:19

高市早苗最新表態(tài)還想?;^!

高市早苗最新表態(tài)還想?;^2025-12-04 14:19:52

朝武裝力量工程部隊在俄排雷畫面曝光

朝武裝力量工程部隊在俄排雷畫面曝光2025-12-04 14:18:24

中國準航母艦隊或繞澳航行 澳海軍無法應(yīng)對 實力懸殊引發(fā)擔憂

中國準航母艦隊或繞澳航行澳海軍無法應(yīng)對2025-12-04 13:31:09

金建希受審時雙腿發(fā)軟由兩人攙扶 面臨15年刑期及巨額罰款

金建希受審時雙腿發(fā)軟由兩人攙扶2025-12-04 14:24:41

無殲擊機護航時我方成功驅(qū)離外機

無殲擊機護航時我方成功驅(qū)離外機2025-12-04 13:45:42

哈登創(chuàng)造生涯單場0罰球最高得分紀錄 率隊終結(jié)5連敗

哈登創(chuàng)造生涯單場0罰球最高得分紀錄2025-12-04 14:29:13

颯!新畢業(yè)女飛行員改裝首飛 藍天夢再進一步

颯,新畢業(yè)女飛行員改裝首飛2025-12-04 14:28:30

失去親信的澤連斯基還能堅持多久 生死抉擇

失去親信的澤連斯基還能堅持多久2025-12-04 13:05:10

日本擬打造宇宙作戰(zhàn)集團 推進太空軍事化

日本擬打造宇宙作戰(zhàn)集團2025-12-04 13:14:34

中俄向日本右翼政治勢力發(fā)出嚴重警告!

中俄向日本右翼政治勢力發(fā)出嚴重警告2025-12-04 13:52:27

日本自民黨,再被告發(fā) 違規(guī)捐款引爭議

日本自民黨,再被告發(fā)2025-12-04 14:21:46

日本宮古島居民擔心島嶼變戰(zhàn)場 安全與生存的錯位

日本宮古島居民擔心島嶼變戰(zhàn)場2025-12-04 13:30:41

日本學(xué)者:高市錯誤言論破壞《中日聯(lián)合聲明》

高市錯誤言論破壞中日聯(lián)合聲明2025-12-04 14:23:31

愛潑斯坦私人島嶼內(nèi)景首次曝光 細節(jié)令人不寒而栗

愛潑斯坦私人島嶼內(nèi)景首次曝光2025-12-04 14:20:13

日本持續(xù)推進核污染水排海!

日本持續(xù)推進核污染水排海2025-12-04 13:17:22

日本著急替馬克龍做決定!

日本著急替馬克龍做決定2025-12-04 13:20:00

美空軍一F16C戰(zhàn)機墜毀 飛行員成功逃生

美空軍一F16C戰(zhàn)機墜毀2025-12-04 14:20:53

部分門店將老國標電動車轉(zhuǎn)二手賣 潛藏安全與法律風險

部分門店將老國標電動車轉(zhuǎn)二手賣2025-12-04 14:30:35

幼師“15天虐童上千次”案9日將開庭!

幼師“15天虐童上千次”案9日將開庭2025-12-04 14:16:03

中國應(yīng)該向巴基斯坦出口殲35嗎 引發(fā)外界廣泛猜測

中國應(yīng)該向巴基斯坦出口殲35嗎2025-12-04 14:24:04

官方通報水渠石塊被指一掰就掉 砂漿強度不足問題待整改

官方通報水渠石塊被指一掰就掉2025-12-04 14:20:32

農(nóng)戶用糧食畫《瘋狂動物城》巨幅海報 創(chuàng)意致敬票房佳績

農(nóng)戶用糧食畫瘋狂動物城巨幅海報2025-12-04 14:22:59

美財長拒答“是否保衛(wèi)臺灣” 避談敏感問題

美財長拒答是否保衛(wèi)臺灣2025-12-04 14:28:50

日本別忘了戰(zhàn)敗國的義務(wù) 正視歷史履行承諾

日本別忘了戰(zhàn)敗國的義務(wù)2025-12-04 14:29:20

相關(guān)新聞