“雷軍千萬(wàn)年薪要挖"的DeepSeek羅福莉官宣加入小米 共赴AGI未來(lái)!11月12日,前DeepSeek研究員羅福莉加入小米。她在朋友圈發(fā)文表示:“智能終將從語(yǔ)言邁向物理世界。我正在Xiaomi MiMo,和一群富有創(chuàng)造力、才華橫溢且真誠(chéng)熱愛(ài)的研究員,致力于構(gòu)建這樣的未來(lái),全力奔赴我們心目中的AGI?!?/p>
今年10月,小米AI團(tuán)隊(duì)與北京大學(xué)聯(lián)合發(fā)布了一篇關(guān)于MoE與強(qiáng)化學(xué)習(xí)的論文,其中已經(jīng)出現(xiàn)羅福莉的名字。Xiaomi MiMo是小米首個(gè)推理大模型,羅福莉的加入也是對(duì)此前傳言的回應(yīng)。
2024年底,DeepSeek發(fā)布了新一代大語(yǔ)言模型DeepSeek-V3,并宣布開(kāi)源。該模型在AI圈爆火后,作為DeepSeek-V2關(guān)鍵開(kāi)發(fā)者之一的羅福莉走進(jìn)大眾視野,被稱為95后AI“天才少女”。羅福莉本科就讀于北京師范大學(xué)計(jì)算機(jī)專業(yè),碩士畢業(yè)于北京大學(xué)計(jì)算語(yǔ)言學(xué)專業(yè)。
碩士畢業(yè)后,羅福莉先是在阿里達(dá)摩院從事預(yù)訓(xùn)練語(yǔ)言模型相關(guān)的工作,負(fù)責(zé)AliceMind開(kāi)源項(xiàng)目并主導(dǎo)開(kāi)發(fā)了多語(yǔ)言預(yù)訓(xùn)練模型VECO。2022年,她加入幻方量化從事深度學(xué)習(xí)相關(guān)策略建模和算法研究,之后又跳槽到DeepSeek擔(dān)任深度學(xué)習(xí)研究員,參與研發(fā)MoE大模型DeepSeek-V2。
就在DeepSeek-V3發(fā)布前幾天,小米創(chuàng)始人雷軍已開(kāi)出千萬(wàn)元年薪招聘羅福莉,領(lǐng)導(dǎo)小米AI大模型團(tuán)隊(duì)。當(dāng)時(shí)有消息稱,小米公司正在積極搭建自己的GPU萬(wàn)卡集群,以加大對(duì)AI大模型的投入力度。小米大模型團(tuán)隊(duì)在成立之初就已擁有6500張GPU資源,此次搭建GPU萬(wàn)卡集群將進(jìn)一步提升小米在AI大模型領(lǐng)域的研發(fā)實(shí)力。據(jù)知情人士透露,該計(jì)劃已經(jīng)實(shí)施數(shù)月之久,雷軍在其中扮演了重要角色,認(rèn)為手機(jī)是AI硬件領(lǐng)域的核心,小米必須全力以赴。
今年4月,小米開(kāi)源了首個(gè)為推理而生的大模型“Xiaomi MiMo”。在數(shù)學(xué)推理(AIME 24-25)和代碼競(jìng)賽(LiveCodeBench v5)公開(kāi)測(cè)評(píng)集上,MiMo僅用7B的參數(shù)規(guī)模,超越了OpenAI的閉源推理模型o1-mini和阿里Qwen更大規(guī)模的開(kāi)源推理模型 QwQ-32B-Preview。MiMo是全新成立不久的小米大模型Core團(tuán)隊(duì)的初步嘗試。小米大模型Core團(tuán)隊(duì)稱,“2025年雖看似是大模型逐夢(mèng)的后半程,但堅(jiān)信AGI的征途仍漫長(zhǎng)。我們將從務(wù)實(shí)創(chuàng)新出發(fā),勇敢探索未知,用思考突破智能邊界,用創(chuàng)造回應(yīng)每一次好奇?!?/p>