中國AI資產(chǎn)的重估時(shí)機(jī)是否已至 Qwen2.5-Max引領(lǐng)突破

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-01-30 13:14:37 華爾街見聞

農(nóng)歷除夕夜，在全球華人喜迎新春之時(shí)，紐約證券交易所的電子屏上，阿里巴巴股價(jià)在收盤前從漲幅1%快速拉升至6.7%。這一行情異動背后是一場技術(shù)奇襲。

1月29日凌晨，阿里通義千問團(tuán)隊(duì)悄然上線的大模型Qwen2.5-Max在多個權(quán)威基準(zhǔn)測試中展現(xiàn)出與全球頂級模型比肩的性能。這是繼DeepSeek之后，中國AI陣營在高性能、低成本技術(shù)路線上的又一重要突破。市場人士分析稱，此前過度聚焦DeepSeek，忽視了包括阿里通義在內(nèi)的中國AI整體性追趕。行業(yè)媒體認(rèn)為，若阿里Qwen-2.5-max的確性能超過V3，可以對其RL推理模型給予更大期待。

當(dāng)阿里云展現(xiàn)出“強(qiáng)大模型+充足算力+完整云平臺”的組合優(yōu)勢時(shí)，這是否印證了類似去年北美云計(jì)算服務(wù)商的投資邏輯？如果美股因AI整體增值10萬億美元，中國AI資產(chǎn)的重估時(shí)機(jī)是否已至？

Qwen2.5-Max采用超大規(guī)模MoE架構(gòu)，基于超過20萬億token的預(yù)訓(xùn)練數(shù)據(jù)。在MMLU-Pro、LiveCodeBench、LiveBench和Arena-Hard等多個權(quán)威評測中，該模型均展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至領(lǐng)先的性能。阿里團(tuán)隊(duì)表示，隨著后訓(xùn)練技術(shù)的不斷進(jìn)步，下一個版本將有望達(dá)到更高水平。

Qwen2.5團(tuán)隊(duì)同步發(fā)布了兩個創(chuàng)新型號：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。這些開源模型支持高達(dá)100萬token的上下文窗口，成為業(yè)內(nèi)首個達(dá)到此規(guī)模的公開可用模型。這些模型使用稀疏注意力，處理百萬token輸入的速度比傳統(tǒng)方法快3到7倍，輸出長度可達(dá)8000個token。在測試中，14B型號和Qwen2.5-Turbo在查找非常長的文檔中的隱藏?cái)?shù)字時(shí)都達(dá)到了完美的準(zhǔn)確性，較小的7B型號也表現(xiàn)良好，只有輕微的錯誤。在RULER、LV-Eval和LongbenchChat等要求更高的復(fù)雜的上下文測試中，百萬token模型的表現(xiàn)優(yōu)于128K token模型，尤其是在超過64K token的序列中，14B型號在RULER中得分超過90分，持續(xù)擊敗gpt-4o mini。

如果說DeepSeek V3的橫空出世展現(xiàn)了中國AI的銳度，那么本次阿里的突破則體現(xiàn)了產(chǎn)業(yè)生態(tài)的深度進(jìn)化。在Qwen2.5-Max發(fā)布當(dāng)天，阿里云百煉平臺同步開放了完整的工具鏈支持，開發(fā)者可以直接在云端調(diào)用。這種“超算集群+開源生態(tài)+云原生”的三位一體架構(gòu)，與北美AWS、Azure、GCP三大云服務(wù)商的商業(yè)模式形成鏡像。根據(jù)摩根士丹利最新研報(bào)，低成本高性能模型也將重塑數(shù)據(jù)中心和軟件行業(yè)格局。對于中國數(shù)據(jù)中心而言，短期內(nèi)大型科技公司采用類似技術(shù)路線可能減少AI訓(xùn)練相關(guān)需求，但從長遠(yuǎn)來看，低成本模型將推動推理需求增長，對一線城市數(shù)據(jù)中心形成利好。對于中國軟件行業(yè)，AI模型成本的降低將降低應(yīng)用程序運(yùn)行AI功能的門檻，從供給側(cè)改善行業(yè)環(huán)境。如果阿里Qwen-2.5-max的性能確實(shí)展現(xiàn)出預(yù)期水平，加之其低成本優(yōu)勢與完整云生態(tài)，有理由期待它將引發(fā)中國AI資產(chǎn)新一輪重估。

(責(zé)任編輯：張蕾)

關(guān)閉

中國AI資產(chǎn)的重估時(shí)機(jī)是否已至 Qwen2.5-Max引領(lǐng)突破

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)