一則消息突然引爆市場。今日,小米集團(tuán)股價一度大漲超過5%,金山云漲幅更是超過了18%。小米大模型微信公眾號宣布,小米開源了首個專為推理設(shè)計的大模型“Xiaomi MiMo”,該模型從預(yù)訓(xùn)練到后訓(xùn)練全面提升了推理能力。
當(dāng)前,AI大模型的競爭再度進(jìn)入白熱化階段。4月29日,阿里巴巴通義千問發(fā)布了新版Qwen 3系列模型。同一天,馬斯克也宣布將在下周向SuperGrok訂閱者發(fā)布Grok 3.5的早期測試版。
券商機(jī)構(gòu)分析指出,國內(nèi)外大模型能力差距正在縮小,國產(chǎn)算力芯片持續(xù)進(jìn)步,國內(nèi)頭部互聯(lián)網(wǎng)廠商加大資本支出,為國內(nèi)AI的發(fā)展奠定了基礎(chǔ)。隨著國內(nèi)外巨頭大模型的不斷迭代,消費者端或有望迎來殺手級應(yīng)用。
4月30日,小米系股票全線拉升,小米集團(tuán)盤中一度上漲超過5%,金山云漲幅超過18%,金山軟件最高漲超6%。港股云計算板塊同樣表現(xiàn)強(qiáng)勁,金蝶國際、中國軟件國際和阿里巴巴-W等公司股價均有不同程度的上漲。
據(jù)“小米大模型”公眾號消息,MiMo在數(shù)學(xué)推理(AIME 24-25)和代碼競賽(LiveCodeBench v5)公開測評集上,以7B參數(shù)規(guī)模超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開源推理模型QwQ-32B-Preview。官方稱,在相同強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)情況下,MiMo-7B在數(shù)學(xué)與代碼領(lǐng)域的表現(xiàn)顯著領(lǐng)先。目前,MiMo-7B全系列模型已在HuggingFace平臺開源,并發(fā)布了詳細(xì)技術(shù)報告。
小米技術(shù)團(tuán)隊表示,MiMo的核心突破在于預(yù)訓(xùn)練與后訓(xùn)練階段的協(xié)同優(yōu)化。在預(yù)訓(xùn)練階段,通過挖掘高質(zhì)量推理語料并合成約2000億tokens專項數(shù)據(jù),采用三階段漸進(jìn)訓(xùn)練策略,累計訓(xùn)練量達(dá)25萬億tokens。后訓(xùn)練階段則引入創(chuàng)新強(qiáng)化學(xué)習(xí)技術(shù),包括自研算法和策略,有效提升模型在復(fù)雜任務(wù)中的穩(wěn)定性。技術(shù)團(tuán)隊還開發(fā)了“Seamless Rollout”系統(tǒng),使訓(xùn)練效率大幅提升。
值得注意的是,就在小米宣布“Xiaomi Mimo”開源前,阿里巴巴通義千問于4月29日凌晨發(fā)布了新版Qwen 3系列模型,包括2個MoE模型和6個dense模型。通義千問表示,Qwen 3在多個權(quán)威評測中表現(xiàn)出色,實現(xiàn)了“小而強(qiáng)大”的目標(biāo)。Qwen 3融合了推理與非推理能力,在邏輯分析和創(chuàng)意生成等任務(wù)中表現(xiàn)卓越。
馬斯克也在社交平臺上宣布,下周將向SuperGrok訂閱者發(fā)布Grok 3.5的早期測試版,這是第一個能夠準(zhǔn)確回答有關(guān)火箭發(fā)動機(jī)或電化學(xué)技術(shù)問題的人工智能。全球AI大模型的競爭愈發(fā)激烈,過去119天內(nèi),中美十家主要大模型公司發(fā)布了14款基礎(chǔ)大模型。國際市場調(diào)研機(jī)構(gòu)Artificial Analysis發(fā)布的報告顯示,美國大模型雖然目前仍領(lǐng)先,但中國的差距正在不斷縮小。
西部證券認(rèn)為,AI大模型能力提升和使用成本下降是主旋律,多模態(tài)或逐步成為未來基礎(chǔ)模型的標(biāo)準(zhǔn)配置,進(jìn)一步拉動算力需求。開源證券看好AI Agent的應(yīng)用前景,預(yù)計AI Agent將在電商、營銷、CRM、金融、法律等多個場景加速落地。天風(fēng)證券表示,通義千問體系在模型能力、硬件能力和生態(tài)建設(shè)上保持領(lǐng)先,已實現(xiàn)全模態(tài)覆蓋,成為全球最大模型開源生態(tài)。
日韓股市高開,日經(jīng)225指數(shù)開盤上漲0.9%,報38046.97點,個股普漲韓國KOSPI指數(shù)開盤上漲0.8%,報2691.06點
2025-05-29 11:35:07日韓股市全線大漲