AI檢測器的誤判概率大嗎?一篇2024年教育技術領域的Q1級頂刊論文在檢測了七款國外主流AI檢測器后發(fā)現(xiàn),這些檢測器對未經(jīng)過改寫的AI生成內容的平均識別準確率為39.5%,對于人類寫作的對照樣本識別準確率為67%。這意味著人類有33%的概率被誤判為AI,而AI卻有高于60%的概率可以蒙混過關。
在新版本發(fā)布的公告中,格子達將其中一條區(qū)分人與AI創(chuàng)作的標準描述為:人類寫作存在合理的不確定性,AI生成的文本過于“流暢”。這也導致了大學生們的無奈:為了降低AI率,不得不把論文改“笨”。
網(wǎng)友@江楓漁火對愁眠 分享了為AI率折腰的經(jīng)歷,她抱著把論文修改到最好的心態(tài),卻不得不弱化邏輯性,改書面語為口語,“雖然AI率達標了,終于定稿了,但是我對自己的論文不滿意了,自己把自己的論文改爛真的很難受”。
網(wǎng)絡上也有不少經(jīng)驗帖分享用AI打敗AI的方法,但更改后的論文質量大打折扣。嘗試過用系統(tǒng)降低AI率的一帆表示,AI改寫的語句“不像人寫的”。刪減邏輯詞、增加口水話后,論文與嚴謹、專業(yè)的大眾印象漸行漸遠。
除了類似“AI 檢測率”這樣的硬指標劃定,國內一些高校也在探索其他規(guī)范使用 AI 的方式,比如中國傳媒大學繼續(xù)教育學部設計了《本科畢業(yè)論文(設計)生成式人工智能使用情況說明表》,由學生自主披露論文中的 AI 使用情況。而使用了AI智評系統(tǒng)的廣東海洋大學也在指導文件里公布了允許使用AI工具的范圍,如“可用于文獻檢索、關鍵詞推薦和文獻管理,但需確保引用文獻的真實性與可靠性??捎糜谕扑]統(tǒng)計圖表類型和輔助制圖,但不得用于生成或修改原始研究數(shù)據(jù)及關鍵研究圖表”。
關于AI檢測器,美國前20所頂尖高校普遍持“不建議使用”態(tài)度,考慮的主要因素為現(xiàn)有檢測技術不成熟、系統(tǒng)無法提供證據(jù)、誤判和漏判現(xiàn)象頻出。Open AI公司在官網(wǎng)“教育者常見問題解答”中稱:“我們對檢測器的研究表明它們并不可靠,因為教育工作者可能會對學生作出判斷,并造成長期影響”。在訓練過程中,其研發(fā)的AI生成內容檢測器將莎士比亞的作品和《獨立宣言》等人類撰寫的內容標記為 AI 生成。
今天早上,我收到一條私信,內容讓我非常生氣。一位粉絲說他跟著某直播間的“AI炒股導師”投了30萬,結果一周內虧掉了一半。對方還推卸責任,說是DeepSeek推薦的
2025-03-06 14:35:18用DeepSeek炒股靠譜嗎高考志愿填報的帷幕已經(jīng)拉開,考生和家長們面對海量信息往往感到無從下手。一些人開始求助于AI高考志愿填報助手
2025-06-13 17:00:03AI填報高考志愿靠譜嗎