兩個博士1年干出120億獨角獸 AI測評引發(fā)資本熱潮!美國加州大學(xué)伯克利分校孵化的創(chuàng)業(yè)公司LMArena成立僅一年,便成為估值17億美元的獨角獸。該公司通過構(gòu)建全球最大的用戶偏好大模型實時數(shù)據(jù)集,滿足市場對AI可靠性評估的需求,受到資本市場的高度認(rèn)可。在短短一年內(nèi),LMArena完成了由Andreessen Horowitz(a16z)、Felicis Ventures等頂尖風(fēng)投領(lǐng)投的兩輪融資,包括種子輪1億美元和A輪1.5億美元的資金。
LMArena源自大型模型系統(tǒng)組織(LMSYS),該組織由多所大學(xué)合作發(fā)起,旨在孵化早期開源和研究項目。2023年,加州大學(xué)伯克利分校的兩位博士生Anastasios N. Angelopoulos和Wei-Lin Chiang受LMSYS資助,創(chuàng)立了Chatbot Arena,即LMArena的前身。Chatbot Arena旨在構(gòu)建一個公開透明的評估平臺,反映大型語言模型在現(xiàn)實世界中的應(yīng)用情況。
Chatbot Arena于2023年5月正式推出,用戶可以通過匿名方式選擇更喜歡的答案,對不同的人工智能模型進行投票。2025年1月,Chatbot Arena注冊為商業(yè)化實體LMArena,由Anastasios N. Angelopoulos擔(dān)任首席執(zhí)行官、Wei-Lin Chiang擔(dān)任首席技術(shù)官,Ion Stoica是聯(lián)合創(chuàng)始人兼顧問。三位創(chuàng)始人均具有豐富的學(xué)術(shù)背景和技術(shù)經(jīng)驗。
目前,LMArena已經(jīng)吸引了數(shù)百萬參與者,記錄超過300萬次比較,評估了400多個模型。LMArena利用實時評估來緩解大模型基準(zhǔn)測試中可能出現(xiàn)的問題,通過持續(xù)收到來自真實用戶的新反饋進行修正。這些反饋被梳理成開放的排行榜和技術(shù)文章,為大模型的性能提供重要意見,指導(dǎo)LLM的改進和持續(xù)開發(fā)。此外,LMArena還與開源和商業(yè)模型供應(yīng)商合作,將他們的最新模型投放到平臺社區(qū)進行預(yù)測試。
然而,LMArena的商業(yè)模式也面臨爭議。盡管其在短時間內(nèi)完成兩輪融資并躍升為獨角獸,但其測評內(nèi)容的可靠性仍受到質(zhì)疑。一些人認(rèn)為,LMArena完全依賴于不受控制的志愿者在平臺上進行的游戲化勞動,用戶可能沒有動力認(rèn)真思考作答。此外,用戶更傾向于選擇帶有表情符號和冗長的內(nèi)容,而不是實質(zhì)性高質(zhì)量的內(nèi)容。因此,這種測評模式可能無法真正篩選出能生產(chǎn)高質(zhì)答案的大模型。
在2024年《福布斯》美國富豪榜上,36歲的Edwin Chen以180億美元的身家成為最年輕的億萬富豪
2025-09-29 10:25:5685后華裔理工男干出千億獨角獸2012年,布朗大學(xué)計算機系大二學(xué)生Dylan Field在Flipboard實習(xí)時,注意到設(shè)計師們用Adobe軟件來回傳輸PSD文件的場景
2025-08-11 08:51:0190后輟學(xué)生干出年內(nèi)最大IPO