电竞下注-中国电竞赛事及体育赛事平台

<rt id="u0ta9"><video id="u0ta9"></video></rt>

<rp id="u0ta9"><wbr id="u0ta9"></wbr></rp><option id="u0ta9"><legend id="u0ta9"><abbr id="u0ta9"></abbr></legend></option><big id="u0ta9"><object id="u0ta9"></object></big>

中華網(wǎng) china.com

新聞

國內(nèi) 國際社會體育專題軍事財經(jīng) 滾動政務(wù) 冬奧

首個AI高考全卷評測結(jié)果發(fā)布數(shù)學(xué)成大模型短板

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2024-06-20 06:07:28 界面新聞

近期，上海人工智能實(shí)驗(yàn)室的官方微博分享了一則消息：司南評測體系OpenCompass啟動了首次針對大模型的“語數(shù)外”高考全科目能力測評，使用的是全國新課標(biāo)I卷作為測試基準(zhǔn)。這次特別挑選了六個開源模型，以及OpenAI的GPT-4o參與，所有開源模型的公開時間均早于高考日期，以保障測試環(huán)境的封閉性和公正性。評分工作則委托給具有實(shí)際高考閱卷經(jīng)驗(yàn)的教師執(zhí)行，確保評估結(jié)果貼近真實(shí)的閱卷標(biāo)準(zhǔn)。測試結(jié)果揭曉，阿里通義千問Qwen2-72B、OpenAI的GPT-4o以及書生·浦語2.0文曲星（InternLM2-20B-WQX）在眾多模型中脫穎而出，分列前三名，它們的得分率分別是72.1%、70.5%和70.4%。從整體表現(xiàn)看，這些模型在語言類科目上展現(xiàn)了較強(qiáng)的能力，語文科目的平均得分率達(dá)到67%，英語更是高達(dá)81%。相比之下，數(shù)學(xué)成為多數(shù)模型的弱項(xiàng)，平均得分率低至36%。其中，InternLM2-20B-WQX在數(shù)學(xué)上獲得了最高分75分，盡管如此，這一成績?nèi)晕茨芸邕^及格線。

(責(zé)任編輯：張蕾)

關(guān)閉

誰會是哈里斯的搭檔多位政要成熱門人選

誰會是哈里斯的搭檔2024-07-22 14:08:31

美國會迎來歷史上首位女總統(tǒng)嗎？哈里斯提名在望

美國會迎來歷史上首位女總統(tǒng)嗎2024-07-22 14:08:15

拜登退選如何影響選戰(zhàn)？民主黨“換將”迎挑戰(zhàn)

拜登退選如何影響選戰(zhàn)？2024-07-22 14:07:48

拜登退選如何影響選戰(zhàn)？民主黨“換將”迎挑戰(zhàn)

拜登退選如何影響選戰(zhàn)？2024-07-22 14:07:48

沙利文稱美國可能允許烏軍用美國武器深入打擊俄領(lǐng)土，俄外交官：美仍想給俄造成“戰(zhàn)略失敗”

沙利文稱美國可能允許烏軍用美國武器深入打擊俄領(lǐng)土，俄外交官：美仍想給俄造成“戰(zhàn)略失敗”2024-07-22 10:37:56

樊振東：之前強(qiáng)迫自己看乒乓球現(xiàn)在也會從皇馬的比賽中獲取力量

樊振東：之前強(qiáng)迫自己看乒乓球現(xiàn)在也會從皇馬的比賽中獲取力量2024-07-22 14:05:56

日防相木原稔今起訪歐，同英意共同開發(fā)新戰(zhàn)機(jī)計(jì)劃有變數(shù)？

日防相木原稔今起訪歐，同英意共同開發(fā)新戰(zhàn)機(jī)計(jì)劃有變數(shù)？2024-07-22 10:25:52

對師德失范零容忍就要刮骨療毒中國人民大學(xué)嚴(yán)正聲明

對師德失范零容忍就要刮骨療毒2024-07-22 14:02:46

內(nèi)塔尼亞胡訪美與拜登會晤將按計(jì)劃進(jìn)行，具體時間未知

內(nèi)塔尼亞胡訪美與拜登會晤將按計(jì)劃進(jìn)行，具體時間未知2024-07-22 10:35:29

澤連斯基：如果特朗普勝選，烏克蘭只能……

澤連斯基：如果特朗普勝選，烏克蘭只能……2024-07-22 10:08:14

種地吧導(dǎo)演曾回應(yīng)三四季規(guī)劃綜藝發(fā)展與粉絲理性并行

種地吧導(dǎo)演曾回應(yīng)三四季規(guī)劃2024-07-22 14:00:54

千里奔襲胡塞武裝，以軍要過幾道坎？

千里奔襲胡塞武裝，以軍要過幾道坎？2024-07-22 10:32:02

黑人選民也沒底：美國還沒準(zhǔn)備好迎接一位女總統(tǒng)，遑論一位黑人女總統(tǒng)

黑人選民也沒底：美國還沒準(zhǔn)備好迎接一位女總統(tǒng)，遑論一位黑人女總統(tǒng)2024-07-22 14:03:36

沖突前線處境艱難，美歐援烏明顯降溫，內(nèi)外壓力涌向澤連斯基！

沖突前線處境艱難，美歐援烏明顯降溫，內(nèi)外壓力涌向澤連斯基！2024-07-22 10:22:08

董宇輝不希望和俞敏洪的感情被誤會內(nèi)部管理受質(zhì)疑

董宇輝不希望和俞敏洪的感情被誤會2024-07-22 14:03:23

媽媽回應(yīng)10歲兒子賣冰棍減肥

媽媽回應(yīng)10歲兒子賣冰棍減肥2024-07-22 14:07:30

與臺當(dāng)局首次聯(lián)演，“日本刻意低調(diào)”

與臺當(dāng)局首次聯(lián)演，“日本刻意低調(diào)”2024-07-22 10:09:07

馬斯克再出爭議言論：借微軟 Windows 藍(lán)屏事件攻擊 CrowdStrike 的“多元化”

馬斯克再出爭議言論：借微軟 Windows 藍(lán)屏事件攻擊 CrowdStrike 的“多元化”2024-07-22 14:02:58

一覺醒來，美國發(fā)生歷史性大事

一覺醒來，美國發(fā)生歷史性大事2024-07-22 10:02:39

首次空襲也門，內(nèi)塔尼亞胡：以色列長臂可觸及任何地方

首次空襲也門，內(nèi)塔尼亞胡：以色列長臂可觸及任何地方2024-07-22 10:18:07

首次亮相國際大型活動，解放軍三桅帆船“破浪”號是怎樣的存在？

首次亮相國際大型活動，解放軍三桅帆船“破浪”號是怎樣的存在？2024-07-22 14:05:27

為波音產(chǎn)導(dǎo)引頭短缺，日本“愛國者”導(dǎo)彈生產(chǎn)計(jì)劃被推遲

為波音產(chǎn)導(dǎo)引頭短缺，日本“愛國者”導(dǎo)彈生產(chǎn)計(jì)劃被推遲2024-07-22 10:12:32

硬核軍校錄取通知書大揭秘青春召喚，夢想啟航！

硬核軍校錄取通知書大揭秘2024-07-22 14:00:26

美國會迎來歷史上首位女總統(tǒng)嗎？哈里斯提名在望

美國會迎來歷史上首位女總統(tǒng)嗎2024-07-22 14:08:15

驚人逆轉(zhuǎn)！拜登從首輪辯論到宣布退選的24天，經(jīng)歷了什么？

驚人逆轉(zhuǎn)！拜登從首輪辯論到宣布退選的24天，經(jīng)歷了什么？2024-07-22 14:00:04

家族政治，印度持續(xù)千年的謎題

家族政治，印度持續(xù)千年的謎題2024-07-22 10:31:20

誰會是哈里斯的搭檔多位政要成熱門人選

誰會是哈里斯的搭檔2024-07-22 14:08:31

美“羅斯福”號航母赴紅海小心翼翼，在進(jìn)入印度洋后明顯放緩速度

美“羅斯?！碧柡侥父凹t海小心翼翼，在進(jìn)入印度洋后明顯放緩速度2024-07-22 10:38:26

雷神公司測試“愛國者”雷達(dá)引導(dǎo)“標(biāo)準(zhǔn)6”導(dǎo)彈

雷神公司測試“愛國者”雷達(dá)引導(dǎo)“標(biāo)準(zhǔn)6”導(dǎo)彈2024-07-22 10:12:11

創(chuàng)中國男網(wǎng)新紀(jì)錄！張之臻世界排名升第31名將開啟奧運(yùn)之旅

創(chuàng)中國男網(wǎng)新紀(jì)錄！張之臻世界排名升第31名將開啟奧運(yùn)之旅2024-07-22 14:01:03

ATP漢堡站：菲斯擊敗茲維列夫，首奪500賽冠軍法國新星崛起

ATP漢堡站：菲斯擊敗茲維列夫，首奪500賽冠軍2024-07-22 14:01:51

果然，美國政府還是有辦法……

果然，美國政府還是有辦法……2024-07-22 10:06:32

尋醫(yī)廣播一響一群浙大醫(yī)學(xué)生沖了上去列車上演急救溫情劇

尋醫(yī)廣播一響一群浙大醫(yī)學(xué)生沖了上去2024-07-22 14:00:13

廢棄它，連帶報銷了美軍隱藏的算盤……

廢棄它，連帶報銷了美軍隱藏的算盤……2024-07-22 10:05:01

又扯“中俄威脅”？“美國將明文承諾會用核武器保護(hù)日本”

又扯“中俄威脅”？“美國將明文承諾會用核武器保護(hù)日本”2024-07-22 10:17:25

相關(guān)新聞

今日熱點(diǎn)

受賄1.13億羅保銘一審被判15年巨額貪腐終受懲

黃楊鈿甜起訴B站網(wǎng)絡(luò)侵權(quán)案將開庭

俄羅斯同意全面轉(zhuǎn)讓五代機(jī)技術(shù)，印度會買蘇57嗎？印度空軍急需補(bǔ)強(qiáng)

水銀溫度計(jì)便宜好用為何要禁環(huán)保與健康考量

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動態(tài)
版權(quán)所有中華網(wǎng)

<big id="twjdt"><object id="twjdt"></object></big>