23日,華大生命科學(xué)研究院與之江實(shí)驗(yàn)室聯(lián)合發(fā)布了全球首個(gè)百億參數(shù)可部署的基因組通用基礎(chǔ)模型Genos。該模型支持多達(dá)百萬(wàn)堿基對(duì)的超長(zhǎng)上下文分析,并實(shí)現(xiàn)單堿基分辨率的精準(zhǔn)識(shí)別。
人類(lèi)基因組由30億對(duì)堿基組成,雖然“人類(lèi)基因組計(jì)劃”已經(jīng)破譯了序列,但序列上堿基的具體功能仍需進(jìn)一步識(shí)別和解析?,F(xiàn)有模型大多基于1-2個(gè)參考基因組進(jìn)行訓(xùn)練,難以體現(xiàn)人類(lèi)遺傳資源的多樣性。Genos整合了人類(lèi)泛基因組參考聯(lián)盟、人類(lèi)基因組結(jié)構(gòu)變異圖譜計(jì)劃等多個(gè)權(quán)威公開(kāi)資源,首次將全球范圍內(nèi)636個(gè)高質(zhì)量人類(lèi)基因組作為訓(xùn)練數(shù)據(jù),這些數(shù)據(jù)覆蓋了全球不同人群,有助于更全面理解人類(lèi)遺傳多樣性。
在算法架構(gòu)方面,Genos采用“混合專(zhuān)家”架構(gòu),能夠精準(zhǔn)調(diào)度強(qiáng)相關(guān)算法協(xié)同處理,在匯總百億級(jí)龐大參數(shù)時(shí)成功降低推理成本和資源消耗,使模型既強(qiáng)大又好用。測(cè)試結(jié)果顯示,Genos在直接面向臨床應(yīng)用的致病性突變解讀任務(wù)中準(zhǔn)確率達(dá)92%,結(jié)合科學(xué)基礎(chǔ)模型后準(zhǔn)確率高達(dá)98.3%。多項(xiàng)綜合評(píng)測(cè)結(jié)果表明,Genos超越了現(xiàn)有最佳水平模型。
目前,Genos模型已在HuggingFace、魔搭等平臺(tái)全面開(kāi)源開(kāi)放,提供12億和100億參數(shù)兩個(gè)版本,以滿足不同需求。
5月25日晚,一場(chǎng)名為《CMG世界機(jī)器人大賽·系列賽》的機(jī)甲格斗擂臺(tái)賽在杭州舉行,這是全球首個(gè)以人形機(jī)器人為參賽主體的格斗競(jìng)技賽事
2025-05-26 17:38:50全球首個(gè)人形機(jī)器人格斗冠軍誕生