在最近結(jié)束的第六屆阿里巴巴全球數(shù)學(xué)競(jìng)賽中,17歲的江蘇漣水中學(xué)學(xué)生姜萍脫穎而出,她在全球數(shù)萬(wàn)名參賽者中排名12,不僅成為了決賽圈的焦點(diǎn),也是30強(qiáng)中唯一的女性選手。此次競(jìng)賽的一大亮點(diǎn)是首次引入了AI大模型挑戰(zhàn)賽,吸引了563支由全球頂尖學(xué)術(shù)機(jī)構(gòu)和企業(yè)組建的AI團(tuán)隊(duì)與人類選手同臺(tái)競(jìng)技,共解同一套試題。
4月13日,隨著競(jìng)賽的鐘聲響起,數(shù)以萬(wàn)計(jì)的數(shù)學(xué)愛(ài)好者在全球范圍內(nèi)開(kāi)始了他們的智力征程,試題涵蓋選擇題、解答題及證明題等多種類型。然而,盡管AI隊(duì)伍展現(xiàn)了一定的實(shí)力,其平均分達(dá)到了18分,與人類選手持平,最高分卻只有34分,遠(yuǎn)不及人類選手的113分高峰,無(wú)一支AI隊(duì)伍進(jìn)入最終的801人決賽名單。
值得關(guān)注的是,上海建平中學(xué)的涂津豪憑借獨(dú)創(chuàng)的AI策略獲得了AI隊(duì)伍中的最高分,該策略靈感來(lái)源于自辯論思想,通過(guò)大模型之間的多輪問(wèn)答驗(yàn)證來(lái)逼近問(wèn)題的最佳解答。而來(lái)自西南交通大學(xué)和中國(guó)人民大學(xué)的兩支AI隊(duì)伍,則分別憑借獨(dú)特的Multi-Agent系統(tǒng)設(shè)計(jì)榮獲亞軍和季軍,展現(xiàn)了不同的解題思路與技術(shù)路徑。
浙江大學(xué)計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)實(shí)驗(yàn)室的研究員陳天楚指出,當(dāng)前大語(yǔ)言模型(LLM)在處理數(shù)學(xué)競(jìng)賽這類需要反復(fù)試錯(cuò)與深度思考的任務(wù)時(shí),仍面臨邏輯推理和嚴(yán)謹(jǐn)思考的局限性,盡管已有通過(guò)Prompt工程提升模型表現(xiàn)的嘗試,但效果有限,尚不能與人類專家相提并論。
賽事組委會(huì)在點(diǎn)評(píng)中也強(qiáng)調(diào)了AI在邏輯推理和證明題方面的不足。一位互聯(lián)網(wǎng)企業(yè)的技術(shù)總監(jiān)認(rèn)為,這次AI挑戰(zhàn)賽不僅是對(duì)“百模大戰(zhàn)”后AI模型能力的檢驗(yàn),更是凸顯了在復(fù)雜邏輯推理和創(chuàng)新思維領(lǐng)域,人類選手依然保持明顯優(yōu)勢(shì)。
盡管AI在本次數(shù)學(xué)競(jìng)賽中的表現(xiàn)未能超越人類,但這場(chǎng)較量被視作推動(dòng)人工智能與數(shù)學(xué)理論發(fā)展的重要契機(jī)。今年,各支AI隊(duì)伍通過(guò)多種技術(shù)創(chuàng)新探索提升AI數(shù)學(xué)能力的新途徑,預(yù)示著未來(lái)人工智能與數(shù)學(xué)領(lǐng)域的互動(dòng)將更加深入。
阿里巴巴全球數(shù)學(xué)競(jìng)賽自2018年創(chuàng)辦以來(lái),以其開(kāi)放的參賽門檻和廣泛的參與度,吸引了全球超過(guò)25萬(wàn)人次參與,成為全球最大的在線數(shù)學(xué)競(jìng)賽平臺(tái)之一,持續(xù)激發(fā)著全球數(shù)學(xué)愛(ài)好者的熱情與創(chuàng)造力。
最近,一位名叫姜萍的17歲少女引起了廣泛關(guān)注。她不僅成功入圍2024阿里巴巴全球數(shù)學(xué)競(jìng)賽決賽,還以93分的高分位居全球第12名,成為前30名中唯一的女性選手
2024-06-23 16:50:58姜萍入圍的數(shù)學(xué)競(jìng)賽決賽試題公布成功入圍一全球數(shù)學(xué)競(jìng)賽決賽的江蘇省漣水中等專業(yè)學(xué)校的姜萍,一夜之間爆火。
2024-06-14 16:18:59漣水中等專業(yè)學(xué)校