小米推出在線AI聊天服務(wù)。
12月16日消息,小米今日發(fā)布
Xiaomi MiMo-V2-Flash 開源 MoE 模型,總參數(shù)量309B,活躍參數(shù)量15B,專為智能體AI設(shè)計(jì),專注于快。
小米官方介紹稱,這是一個(gè)專為極致推理效率自研的總參數(shù)309B(激活15B)的MoE模型,通過Hybrid注意力架構(gòu)創(chuàng)新及多層MTP推理加速,在多個(gè)Agent測(cè)評(píng)基準(zhǔn)上保持進(jìn)入全球開源模型 Top 2;
代碼能力超過所有開源模型,比肩標(biāo)桿閉源模型 Claude 4.5 Sonnet,但推理成本僅為其2.5%,生成速度提升2倍。
Xiaomi MiMo-V2-Flash 采用 1:5 的 Global Attention 與 Sliding Window Attention (SWA) 混合結(jié)構(gòu),128 窗口大小,原生 32K 外擴(kuò) 256K 訓(xùn)練。
IT之家注意到,小米推出了一個(gè)在線AI聊天服務(wù)Xiaomi MiMO Studio,用戶可以在其中體驗(yàn) Xiaomi MiMo-V2-Flash。該服務(wù)支持深度搜索和聯(lián)網(wǎng)搜索。
Xiaomi MiMo-V2-Flash 的模型權(quán)重和推理代碼均采用 MIT 協(xié)議全面開源。MiMo-V2-Flash 的 API 定價(jià)為
輸入 $0.1/M tokens,輸出 $0.3/M tokens,API限時(shí)免費(fèi)。