电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

AI開始下場“掙錢”了!老板用AI正偷偷賺錢,而你還在審它做的17份PPT?

關(guān)鍵詞:
2025-12-24 15:21:23  新浪

AI已經(jīng)不只會「答題」,開始下場「掙錢」了。但它也可能順手給你產(chǎn)出17份PPT,把你淹沒在電子垃圾里。下一代AI也許真能贏過專家,可更刺激的問題是:它會替你上班,還是讓你轉(zhuǎn)職為「AI監(jiān)工」?

悄然之間,人工智能跨越了一個關(guān)鍵門檻:它們現(xiàn)在已能完成具有實際經(jīng)濟價值的工作。

但當你把一份企業(yè)備忘錄交給Claude,讓它做個PPT,結(jié)果它一口氣生成了17個版本。

面對這種「用力過猛」的AI,你可能會懷疑:

它真的具有實用性和經(jīng)濟價值嗎?

對此,賓夕法尼亞大學沃頓商學院教授Ethan Mollick給出了他的回答。


智能體能完成特定任務(wù)


但無法取代工作

考慮到開發(fā)新AI所投入的天量資源,無論是字面意義還是象征意義上,我們卻在精確衡量AI「智能」程度這件事上意外地捉襟見肘。

目前,最普遍的做法是將AI視作人類,通過標準化測試來統(tǒng)計其答對題目的數(shù)量。

這類被稱為「基準測試」的評估體系多達數(shù)十種,已成為衡量AI能力演進的核心標尺。


但AI真的實用性?有經(jīng)濟價值嗎?


要回答這個問題,不能光靠感覺,得看數(shù)據(jù)。

OpenAI發(fā)布了一個名叫GDPVAL的新基準測試。它不像以往的數(shù)學或常識測試,而是專門考察大模型在現(xiàn)實工作場景中能否創(chuàng)造經(jīng)濟價值。

這一次,考得很「實戰(zhàn)」。

OpenAI組了個高端局:

然后,OpenAI讓各家的大模型和其他專家親自完成這些任務(wù)。第三組專家對結(jié)果進行評分,評分的專家不知道哪些答案來自AI,哪些來自人類,每個問題的評分時間大約需要一小時。

測試結(jié)果非常耐人尋味:

人類專家贏了,但是贏得很難(勉強獲勝)。

圖1:GDPVAL中,不同模型在對應任務(wù)上和人類具有相同或更好水平的比例。


同時,測試發(fā)現(xiàn)AI進步極快:

較新的模型得分遠超舊模型。


輸在哪?

有趣的是,大模型輸給人類,并不是因為「幻覺」或「胡說八道」,主要是因為

格式排版不好

沒能精確遵循指令

——而這些恰恰是最容易修復的短板。

圖2:不同領(lǐng)域中,大模型的表現(xiàn)好壞差異較大

如果當前趨勢持續(xù),下一代人工智能模型在這項測試中應超越人類專家。但這意味著AI已做好準備,來取代人類工作了嗎?


回答是否定

。

這里的關(guān)鍵在于:

GDPVAL測試的是「任務(wù)」(Task),而我們做的是「工作」(Job)。

只要AI還做不到像人類一樣處理復雜互動,它就無法取代你的崗位。

但在這些高價值的任務(wù)中,AI什么時候能達到人類專家級水平?理論上,AI落地已無阻礙?

Ethan Mollick教授認為,AI智能體突然變得具有落地可能,確實讓人大吃一驚。部分原因在于大家對智能體的錯誤認知 。


智能體,工作「續(xù)航能力」指數(shù)級增長

以前,大家認為,AI想獨立完成長任務(wù)非常難,比如寫一個完整的軟件。因為AI只要中間錯一步,后面就全完了(誤差累積)。

但劍橋大學等機構(gòu)聯(lián)手顛覆了這個認知:

AI的能力并沒有遇到瓶頸,反而在爆發(fā)。

預印本鏈接:https://arxiv.org/abs/2509.09677

劍橋大學Akshit Sinha等研究人員挖掘出四大原因:

1)


收益非遞減

:變準一點點,能做的事會暴增

2)


自我修正

:它會停下來檢查,不會被一個錯誤拖死

3)


更長上下文

:一次對話就能裝下更長流程

4)


更強模型能力

:規(guī)劃更穩(wěn),長任務(wù)更不崩

所有這一切意味著,AI智能體能夠應對那些需要更多步驟才能完成的任務(wù),并且這一過程無需人工干預。

圖3:大模型性能的提升不會引起收益遞減的四個原因

因此,指標METR,從GPT-3到GPT-5,在五年間持續(xù)保持了指數(shù)級增長,顯示出智能體能力增加的速度沒有放緩。

圖4:大模型能夠穩(wěn)定完成的任務(wù)所需的耗時變化

該指標衡量AI能以至少50%幾率獨立完成的任務(wù)到底多長。

這意味著我們在不遠的未來,就能夠看到AI完成需要專業(yè)人士一天甚至一周時間才能完成的復雜任務(wù)。


人類決定AI的未來

然而,真正具有自主性智能體并不存在。

目前,我們需要決定如何使用它們,這將決定未來工作的許多方面。當下大多人關(guān)注的重點是用AI取代人類勞動所帶來的風險,而且不難看出這將在未來幾年成為一個主要問題,特別是對于那些只關(guān)注削減成本、而不是利用這些新能力來擴展或轉(zhuǎn)型工作的,同時缺乏想象力的組織。

但在工作中使用AI,會帶來的另一個非常有可能發(fā)生的風險是:我們會無意識地讓智能體去完成一堆比我們當下所做的更多,但完全不必要的任務(wù),例如根據(jù)一個文檔做17個PPT。

我們?nèi)绻徽J真思考我們?yōu)槭裁匆龉ぷ?,以及工作應該是什么樣子,那么會被AI生成的「電子垃圾」大潮淹沒。

那么,替代方案是什么?

OpenAI建議專家可以通過將任務(wù)委托給AI,將AI生成的結(jié)果當成初稿,由人類審查,從而與AI合作解決問題。如果AI生成的初稿不夠好,用戶可在提示詞中提供糾正或優(yōu)化提示詞再試一次。如果那仍然不起作用,他們應該親自完成工作。

如果專家遵循這種工作流程,論文估計他們可以加快40%的工作速度,降低60%的成本。更重要的是,他們可以保持對AI的控制權(quán)。

圖5:不同大模型帶來的速度和成本提升

具有經(jīng)濟實用性的智能體已經(jīng)出現(xiàn)。例如通過讓AI智能體去復現(xiàn)學術(shù)論文,可以應對學術(shù)界的「可復現(xiàn)性危機」。

盡管智能體能夠完成的任務(wù)仍然有限,但它有經(jīng)濟價值,并且價值正在遞增。

出現(xiàn)哪一個未來,區(qū)別不在于AI技術(shù)的演變,而在于我們選擇如何使用AI。通過在我們的判斷中決定什么值得做,而不僅僅是能做什么,我們可以確保這些工具使我們變得更有能力,而不僅僅是更有效率。

(責任編輯:zx0002)
關(guān)閉

神20飛船返回東風著陸場 航天員安全歸來

神20飛船返回東風著陸場2026-01-19 10:28:47

全球央行為何要“瘋搶”黃金 避險與儲備多元化驅(qū)動

全球央行為何要瘋搶黃金2026-01-19 10:26:29

金飾克價漲到1451元 金價創(chuàng)歷史新高

金飾克價漲到1451元2026-01-19 10:25:46

丹麥不敢想:一個北約國家會攻擊另一個成員國 純理論假設(shè)

丹麥不敢想,一個北約國家會攻擊另一個成員國2026-01-19 08:10:14

臺退將稱殲20將改變西太軍力平衡

臺退將稱殲20將改變西太軍力平衡2026-01-19 09:45:57

小伙教人縫寵物服裝月入5萬 萌寵經(jīng)濟新風口

小伙教人縫寵物服裝月入5萬2026-01-19 10:11:57

羅杰艾勒斯去世 動畫界失去巨匠

羅杰艾勒斯去世2026-01-19 10:22:42

全球央行為何要“瘋搶”黃金 避險與儲備多元化驅(qū)動

全球央行為何要瘋搶黃金2026-01-19 10:26:29

美媒聲稱目前還沒有六代機!

美媒聲稱目前還沒有六代機2026-01-19 08:50:34

知情人稱包鋼廠區(qū)爆炸疑轉(zhuǎn)爐故障 多部門緊急救援

知情人稱包鋼廠區(qū)爆炸疑轉(zhuǎn)爐故障2026-01-19 10:07:42

特朗普指控摩根大通 錯誤“去銀行化”引發(fā)爭議

特朗普指控摩根大通2026-01-19 10:14:57

神20飛船返回東風著陸場 航天員安全歸來

神20飛船返回東風著陸場2026-01-19 10:28:47

“高超音速導彈”天團:鷹擊-21、東風-17、東風-26D如何各司其職?

“高超音速導彈”天團:鷹擊-21、東風-17、東風-26D如何各司其職?2026-01-19 08:47:41

一口價黃金漲得比金價還猛 潮宏基吊墜一夜?jié)q了1.9萬

一口價黃金漲得比金價還猛2026-01-19 10:21:04

匈牙利總理:西歐正準備與俄羅斯開戰(zhàn) 歐盟會議變軍事討論

匈牙利總理,西歐正準備與俄羅斯開戰(zhàn)2026-01-19 08:13:15

包鋼板材廠爆炸已致2死84傷 事故原因正深入調(diào)查

包鋼板材廠爆炸已致2死84傷2026-01-19 10:09:55

俄專家稱普京若被暗殺歐洲核彈洗地!

俄專家稱普京若被暗殺歐洲核彈洗地2026-01-19 08:44:58

歐洲被美國逼到墻角 被迫尋求與俄對話

歐洲被美國逼到墻角2026-01-19 09:50:36

三粒進球被吹 巴薩客場不敵皇家社會 五次門框難改敗局

三粒進球被吹巴薩客場不敵皇家社會2026-01-19 10:18:55

15公斤銀磚相當于多少人民幣 白銀投資熱度飆升

15公斤銀磚相當于多少人民幣2026-01-19 10:16:32

專家:美國霸權(quán)露出致命裂縫 航母鬧劇暴露短板

專家,美國霸權(quán)露出致命裂縫2026-01-19 08:27:00

南部戰(zhàn)區(qū)發(fā)聲:完全正當合法 無人機正常訓練

南部戰(zhàn)區(qū)發(fā)聲,完全正當合法2026-01-19 09:41:19

衛(wèi)星發(fā)射前零件失效只能歸零再來 航天探索的堅韌之路

衛(wèi)星發(fā)射前零件失效只能歸零再來2026-01-19 08:11:30

考公救不了“失意”的中年人 窄門里的最后保單

考公救不了失意的中年人2026-01-19 10:16:14

血戰(zhàn)利曼!15公里戰(zhàn)線烏軍只部署千人 烏軍防線告急

血戰(zhàn)利曼,15公里戰(zhàn)線烏軍只部署千人2026-01-19 10:23:22

“給李亞鵬捐款”突然火了!大量網(wǎng)友涌入,捐款已超1300萬 愛心潮涌救助唇腭裂患兒

給李亞鵬捐款突然火了,大量網(wǎng)友涌入,捐款已超1300萬2026-01-19 10:22:23

俄談歐洲多國近期對俄立場 能源博弈影響民生

俄談歐洲多國近期對俄立場2026-01-19 08:34:25

歐美因格陵蘭島再掀貿(mào)易戰(zhàn)!全球匯市開盤巨震、黃金再創(chuàng)新高 市場動蕩加劇

歐美因格陵蘭島再掀貿(mào)易戰(zhàn),全球匯市開盤巨震,黃金再創(chuàng)新高2026-01-19 10:22:02

女子占道直播跳舞引公憤 自私行為遭譴責

女子占道直播跳舞引公憤2026-01-19 10:08:05

神二十成功著陸 應急救援彰顯航天韌性

神二十成功著陸2026-01-19 09:50:07

“南天門計劃”是科幻?未來空天趨勢探析

南天門計劃是科幻2026-01-19 09:34:33

相關(guān)新聞