兩個博士1年干出120億獨角獸 AI測評引發(fā)資本熱潮

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-01-13 08:27:05 新浪財經(jīng)

兩個博士1年干出120億獨角獸 AI測評引發(fā)資本熱潮！美國加州大學(xué)伯克利分校孵化的創(chuàng)業(yè)公司LMArena成立僅一年，便成為估值17億美元的獨角獸。該公司通過構(gòu)建全球最大的用戶偏好大模型實時數(shù)據(jù)集，滿足市場對AI可靠性評估的需求，受到資本市場的高度認(rèn)可。在短短一年內(nèi)，LMArena完成了由Andreessen Horowitz（a16z）、Felicis Ventures等頂尖風(fēng)投領(lǐng)投的兩輪融資，包括種子輪1億美元和A輪1.5億美元的資金。

LMArena源自大型模型系統(tǒng)組織(LMSYS)，該組織由多所大學(xué)合作發(fā)起，旨在孵化早期開源和研究項目。2023年，加州大學(xué)伯克利分校的兩位博士生Anastasios N. Angelopoulos和Wei-Lin Chiang受LMSYS資助，創(chuàng)立了Chatbot Arena，即LMArena的前身。Chatbot Arena旨在構(gòu)建一個公開透明的評估平臺，反映大型語言模型在現(xiàn)實世界中的應(yīng)用情況。

Chatbot Arena于2023年5月正式推出，用戶可以通過匿名方式選擇更喜歡的答案，對不同的人工智能模型進行投票。2025年1月，Chatbot Arena注冊為商業(yè)化實體LMArena，由Anastasios N. Angelopoulos擔(dān)任首席執(zhí)行官、Wei-Lin Chiang擔(dān)任首席技術(shù)官，Ion Stoica是聯(lián)合創(chuàng)始人兼顧問。三位創(chuàng)始人均具有豐富的學(xué)術(shù)背景和技術(shù)經(jīng)驗。

目前，LMArena已經(jīng)吸引了數(shù)百萬參與者，記錄超過300萬次比較，評估了400多個模型。LMArena利用實時評估來緩解大模型基準(zhǔn)測試中可能出現(xiàn)的問題，通過持續(xù)收到來自真實用戶的新反饋進行修正。這些反饋被梳理成開放的排行榜和技術(shù)文章，為大模型的性能提供重要意見，指導(dǎo)LLM的改進和持續(xù)開發(fā)。此外，LMArena還與開源和商業(yè)模型供應(yīng)商合作，將他們的最新模型投放到平臺社區(qū)進行預(yù)測試。

然而，LMArena的商業(yè)模式也面臨爭議。盡管其在短時間內(nèi)完成兩輪融資并躍升為獨角獸，但其測評內(nèi)容的可靠性仍受到質(zhì)疑。一些人認(rèn)為，LMArena完全依賴于不受控制的志愿者在平臺上進行的游戲化勞動，用戶可能沒有動力認(rèn)真思考作答。此外，用戶更傾向于選擇帶有表情符號和冗長的內(nèi)容，而不是實質(zhì)性高質(zhì)量的內(nèi)容。因此，這種測評模式可能無法真正篩選出能生產(chǎn)高質(zhì)答案的大模型。

12 全文共 2 頁下一頁

關(guān)閉

兩個博士1年干出120億獨角獸 AI測評引發(fā)資本熱潮

相關(guān)新聞

今日熱點

頻道熱點