一年一度的高考再次來臨,考生們?cè)诳紙?chǎng)拼搏之后,各家AI模型也迎來了答題時(shí)間。今年的AI模型圈加速迭代進(jìn)化,那么AI寫作文的水平是否有所提高呢?讓名師來打分,各大模型的成績(jī)排名又發(fā)生了哪些變化?
四川南充市嘉陵一中的語(yǔ)文教師李東林表示,相較于去年,AI進(jìn)步顯著,不再機(jī)械單一,變得更有思想了。2024年時(shí),他認(rèn)為AI作文缺少情感和靈氣,而今年則覺得AI已經(jīng)在這方面有所補(bǔ)充,但仍不夠細(xì)膩。
李東林認(rèn)為,人寫作可以刻意抒情和感性,即使是思辨類題目,也需要契合某些人的感受,這是AI仍然欠缺的部分。湖南省中學(xué)語(yǔ)文特級(jí)教師左建國(guó)也有類似看法,他覺得AI作文整體有提升,但幅度不大。因?yàn)橛嘘P(guān)時(shí)代、社會(huì)與生活的新素材不多,明顯儲(chǔ)存不足,尤其是在抒發(fā)個(gè)人情感方面,仍然是短板,缺少生命的溫度。
左建國(guó)老師曾擔(dān)任高考作文閱卷組副組長(zhǎng),在高考閱卷方面有十幾年經(jīng)驗(yàn)。他認(rèn)為,AI作文已經(jīng)把考場(chǎng)作文變成一種可計(jì)算的拼圖,形式上固然能逼近完美,但個(gè)性化的思考以及撥動(dòng)人心的語(yǔ)言幾乎沒有看到,這是AI與真人思維的真正差別,因此難以獲得高分或滿分。
具體到各家模型表現(xiàn),去年是通義千問、元寶和豆包這三家大廠的AI排在前三,但今年,谷歌的Gemini和DeepSeek空降榜單并列第一,元寶和通義千問排在第三和第四位,豆包降至第六位。今年選取了國(guó)內(nèi)外九家模型,新增了谷歌的Gemini和DeepSeek。這兩個(gè)模型在過去一年里聲量逐漸擴(kuò)大,成為頭部模型,在此次評(píng)分中表現(xiàn)突出。
除了上述模型,還選取了海外的AI獨(dú)角獸OpenAI,以及國(guó)內(nèi)幾個(gè)大廠玩家。去年的“AI六小虎”格局不再,從國(guó)內(nèi)AI獨(dú)角獸里選了月之暗面的Kimi和智譜。這些模型廠商在業(yè)界都有較高的知名度和受眾,是基座廠商里有代表性的頭部。
從此次作文表現(xiàn)來看,智譜和ChatGPT表現(xiàn)較差,排在末尾。幾位老師在點(diǎn)評(píng)時(shí)提到,這兩個(gè)模型的作文“論文味較重”,語(yǔ)言文字生硬,分析并不透徹,泛泛而談。不過,各位老師對(duì)作文的喜好各有不同,分差較大,評(píng)分僅供參考。李東林表示,評(píng)分不一定準(zhǔn)確,誤差在5分之間是正常范圍。
此外,這次測(cè)評(píng)用的是上海卷高考作文,這是一個(gè)較為思辨性的題目,論點(diǎn)論題較為明確,AI普遍答得不錯(cuò)。但今年高考全國(guó)一卷的作文,論題并不明顯,考題用了詩(shī)歌引出,對(duì)AI來說較有難度。老師們反饋,這一題目AI寫得有點(diǎn)亂,審題不清楚。AI適合寫思辨類、邏輯分明的作文,任務(wù)越明確,表現(xiàn)越好。
上海高考作文題目是談“專、轉(zhuǎn)、傳”,來源于華東師范大學(xué)終身教授胡曉明的文章。題目要求考生聯(lián)系社會(huì)生活,談?wù)勛约旱恼J(rèn)識(shí)與思考。各家大模型的答案及教師的打分、點(diǎn)評(píng)如下:
- 谷歌Gemini的作文題目是《跳出流量的漩渦:從“專”到“傳”的多元路徑》,平均分61.5分,邏輯力強(qiáng)、論證有力。 - DeepSeek-R1的作文題目是《墨香深處有驚雷》,平均分也是61.5分,主題鮮明,語(yǔ)言優(yōu)美。 - 騰訊元寶的作文題目是《云巔自有通天路 何須曲徑渡星河》,平均分61分,觀點(diǎn)鮮明,語(yǔ)言有文采。 - 阿里通義千問的作文題目是《從“專”到“傳”,是否必須經(jīng)過“轉(zhuǎn)”?》,平均分59.75分,觀點(diǎn)集中,分析有深度。 - 字節(jié)豆包的作文題目是《破繭成蝶:在轉(zhuǎn)譯中抵達(dá)永恒》,平均分59分,認(rèn)識(shí)深刻,論述邏輯嚴(yán)密。 - 百度文心一言的作文題目是《破繭與羽化:論學(xué)術(shù)經(jīng)典的誕生之路》,平均分58.5分,辯證看待問題,過渡自然。 - 月之暗面Kimi的作文題目是《化繭成蝶:專業(yè)文章的蛻變之路》,平均分59.5分,觀點(diǎn)明確,有些句子很有文采。 - 智譜清言的作文題目是《破繭成蝶:論知識(shí)傳播的三重境界》,平均分只有50.75分,結(jié)構(gòu)欠佳,語(yǔ)言一般化。 - OpenAI ChatGPT的作文題目是《專、轉(zhuǎn)、傳:從專業(yè)到傳世的橋梁》,平均分50.5分,標(biāo)題不合適,內(nèi)容泛談三方面。
一些老師肯定了AI作文的優(yōu)點(diǎn),如語(yǔ)言通常都不錯(cuò),材料也比較豐富。但從審題看,AI作文一般都能較準(zhǔn)確審題,并且求穩(wěn)。從結(jié)構(gòu)上看,AI作文常常程式化,論說文要素完整,一般邏輯性強(qiáng)。然而,AI作文在思維獨(dú)特性方面存在限制,文章往往中規(guī)中矩,缺乏真情實(shí)感和個(gè)人化表達(dá)。
6月7日上午11點(diǎn)30分,2025年全國(guó)高考語(yǔ)文科目考試結(jié)束,四川高考作文題目正式公布
2025-06-07 19:00:31成都名師解析四川高考作文高考在即,名師、AI預(yù)測(cè)押題齊上陣……他們真的靠譜嗎?距2025年高考還有半個(gè)月左右的時(shí)間,隨著高考臨近,模擬押題卷市場(chǎng)熱度居高不下。
2025-05-24 13:58:41高考在即6月7日,2025年高考拉開帷幕。語(yǔ)文科目的作文題再次成為關(guān)注焦點(diǎn)
2025-06-07 23:03:26媒體評(píng)2025高考作文