高考閱卷名師評(píng)9大AI高考作文 AI進(jìn)步顯著但仍缺情感

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2025-06-08 10:32:19 第一財(cái)經(jīng)

一年一度的高考再次來臨，考生們?cè)诳紙?chǎng)拼搏之后，各家AI模型也迎來了答題時(shí)間。今年的AI模型圈加速迭代進(jìn)化，那么AI寫作文的水平是否有所提高呢？讓名師來打分，各大模型的成績(jī)排名又發(fā)生了哪些變化？

四川南充市嘉陵一中的語(yǔ)文教師李東林表示，相較于去年，AI進(jìn)步顯著，不再機(jī)械單一，變得更有思想了。2024年時(shí)，他認(rèn)為AI作文缺少情感和靈氣，而今年則覺得AI已經(jīng)在這方面有所補(bǔ)充，但仍不夠細(xì)膩。

李東林認(rèn)為，人寫作可以刻意抒情和感性，即使是思辨類題目，也需要契合某些人的感受，這是AI仍然欠缺的部分。湖南省中學(xué)語(yǔ)文特級(jí)教師左建國(guó)也有類似看法，他覺得AI作文整體有提升，但幅度不大。因?yàn)橛嘘P(guān)時(shí)代、社會(huì)與生活的新素材不多，明顯儲(chǔ)存不足，尤其是在抒發(fā)個(gè)人情感方面，仍然是短板，缺少生命的溫度。

左建國(guó)老師曾擔(dān)任高考作文閱卷組副組長(zhǎng)，在高考閱卷方面有十幾年經(jīng)驗(yàn)。他認(rèn)為，AI作文已經(jīng)把考場(chǎng)作文變成一種可計(jì)算的拼圖，形式上固然能逼近完美，但個(gè)性化的思考以及撥動(dòng)人心的語(yǔ)言幾乎沒有看到，這是AI與真人思維的真正差別，因此難以獲得高分或滿分。

具體到各家模型表現(xiàn)，去年是通義千問、元寶和豆包這三家大廠的AI排在前三，但今年，谷歌的Gemini和DeepSeek空降榜單并列第一，元寶和通義千問排在第三和第四位，豆包降至第六位。今年選取了國(guó)內(nèi)外九家模型，新增了谷歌的Gemini和DeepSeek。這兩個(gè)模型在過去一年里聲量逐漸擴(kuò)大，成為頭部模型，在此次評(píng)分中表現(xiàn)突出。

除了上述模型，還選取了海外的AI獨(dú)角獸OpenAI，以及國(guó)內(nèi)幾個(gè)大廠玩家。去年的“AI六小虎”格局不再，從國(guó)內(nèi)AI獨(dú)角獸里選了月之暗面的Kimi和智譜。這些模型廠商在業(yè)界都有較高的知名度和受眾，是基座廠商里有代表性的頭部。

從此次作文表現(xiàn)來看，智譜和ChatGPT表現(xiàn)較差，排在末尾。幾位老師在點(diǎn)評(píng)時(shí)提到，這兩個(gè)模型的作文“論文味較重”，語(yǔ)言文字生硬，分析并不透徹，泛泛而談。不過，各位老師對(duì)作文的喜好各有不同，分差較大，評(píng)分僅供參考。李東林表示，評(píng)分不一定準(zhǔn)確，誤差在5分之間是正常范圍。

此外，這次測(cè)評(píng)用的是上海卷高考作文，這是一個(gè)較為思辨性的題目，論點(diǎn)論題較為明確，AI普遍答得不錯(cuò)。但今年高考全國(guó)一卷的作文，論題并不明顯，考題用了詩(shī)歌引出，對(duì)AI來說較有難度。老師們反饋，這一題目AI寫得有點(diǎn)亂，審題不清楚。AI適合寫思辨類、邏輯分明的作文，任務(wù)越明確，表現(xiàn)越好。

上海高考作文題目是談“專、轉(zhuǎn)、傳”，來源于華東師范大學(xué)終身教授胡曉明的文章。題目要求考生聯(lián)系社會(huì)生活，談?wù)勛约旱恼J(rèn)識(shí)與思考。各家大模型的答案及教師的打分、點(diǎn)評(píng)如下：

- 谷歌Gemini的作文題目是《跳出流量的漩渦：從“專”到“傳”的多元路徑》，平均分61.5分，邏輯力強(qiáng)、論證有力。 - DeepSeek-R1的作文題目是《墨香深處有驚雷》，平均分也是61.5分，主題鮮明，語(yǔ)言優(yōu)美。 - 騰訊元寶的作文題目是《云巔自有通天路何須曲徑渡星河》，平均分61分，觀點(diǎn)鮮明，語(yǔ)言有文采。 - 阿里通義千問的作文題目是《從“專”到“傳”，是否必須經(jīng)過“轉(zhuǎn)”？》，平均分59.75分，觀點(diǎn)集中，分析有深度。 - 字節(jié)豆包的作文題目是《破繭成蝶：在轉(zhuǎn)譯中抵達(dá)永恒》，平均分59分，認(rèn)識(shí)深刻，論述邏輯嚴(yán)密。 - 百度文心一言的作文題目是《破繭與羽化：論學(xué)術(shù)經(jīng)典的誕生之路》，平均分58.5分，辯證看待問題，過渡自然。 - 月之暗面Kimi的作文題目是《化繭成蝶：專業(yè)文章的蛻變之路》，平均分59.5分，觀點(diǎn)明確，有些句子很有文采。 - 智譜清言的作文題目是《破繭成蝶：論知識(shí)傳播的三重境界》，平均分只有50.75分，結(jié)構(gòu)欠佳，語(yǔ)言一般化。 - OpenAI ChatGPT的作文題目是《專、轉(zhuǎn)、傳：從專業(yè)到傳世的橋梁》，平均分50.5分，標(biāo)題不合適，內(nèi)容泛談三方面。

一些老師肯定了AI作文的優(yōu)點(diǎn)，如語(yǔ)言通常都不錯(cuò)，材料也比較豐富。但從審題看，AI作文一般都能較準(zhǔn)確審題，并且求穩(wěn)。從結(jié)構(gòu)上看，AI作文常常程式化，論說文要素完整，一般邏輯性強(qiáng)。然而，AI作文在思維獨(dú)特性方面存在限制，文章往往中規(guī)中矩，缺乏真情實(shí)感和個(gè)人化表達(dá)。

(責(zé)任編輯：zx0176)

關(guān)閉

高考閱卷名師評(píng)9大AI高考作文 AI進(jìn)步顯著但仍缺情感

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)