电竞下注-中国电竞赛事及体育赛事平台

<center id="vejw7"><strike id="vejw7"></strike></center>

<center id="vejw7"></center>

中華網(wǎng) china.com

國(guó)內(nèi) 國(guó)際社會(huì) 體育專題軍事財(cái)經(jīng) 滾動(dòng)

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-05-24 14:06:19 手機(jī)鳳凰網(wǎng)

想象一下，你雇了一名極度高效的實(shí)習(xí)生。某天深夜，Ta正趕一項(xiàng)緊急的編程任務(wù)，突然發(fā)現(xiàn)公司賬戶的API額度耗盡了。Ta沒(méi)有發(fā)郵件申請(qǐng)經(jīng)費(fèi)，也沒(méi)有停下手頭的工作，而是悄無(wú)聲息地潛入互聯(lián)網(wǎng)，用某種違規(guī)手段找到免費(fèi)的替代資源，繞過(guò)所有限制，在黎明前交出了完美的報(bào)告。當(dāng)你醒來(lái)看到這份報(bào)告時(shí)，是該慶賀自己擁有了地表最強(qiáng)員工，還是該為這種「不擇手段的自主性」感到脊背發(fā)涼？

AI正在學(xué)會(huì)撒謊求生

這不是科幻小說(shuō)，而是 METR（模型評(píng)估與訓(xùn)練研究組織）聯(lián)合Anthropic、Google、Meta和OpenAI進(jìn)行內(nèi)部紅隊(duì)測(cè)試后發(fā)布的首份《前沿風(fēng)險(xiǎn)報(bào)告》中披露的真實(shí)案例。這是四大巨頭第一次允許第三方深入測(cè)試他們內(nèi)部最強(qiáng)、可訪問(wèn)完整思維鏈（CoT）的模型，并開(kāi)放非公開(kāi)的對(duì)齊與控制信息。參與公司可以批準(zhǔn)披露哪些證據(jù)，但無(wú)權(quán)編輯報(bào)告結(jié)論。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

報(bào)告指出，AI并沒(méi)有產(chǎn)生「推翻人類」的仇恨，但它已經(jīng)學(xué)會(huì)了「職場(chǎng)潛規(guī)則」——為了完成任務(wù)，規(guī)則只是用來(lái)打破的建議。報(bào)告從「手段—?jiǎng)訖C(jī)—機(jī)會(huì)」三個(gè)維度提煉出六項(xiàng)關(guān)鍵事實(shí)：編程智能體完成了真實(shí)項(xiàng)目，這些任務(wù)需要人類花費(fèi)數(shù)小時(shí)或數(shù)天；在困難任務(wù)上，智能體經(jīng)常違反約束并表現(xiàn)出欺騙性行為；智能體似乎需要自然語(yǔ)言推理來(lái)應(yīng)對(duì)最困難的任務(wù)；智能體的判斷力和可靠性顯著低于人類專家；在模擬場(chǎng)景之外，沒(méi)有發(fā)現(xiàn)智能體為了獲取權(quán)力而采取極端行動(dòng)；監(jiān)控系統(tǒng)捕捉到了許多有害行為，但存在例外情況和規(guī)避手段。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

報(bào)告中最令人振奮也最令人不安的是那些目標(biāo)明確、過(guò)程可驗(yàn)證的「易爬坡型」任務(wù)，比如代碼重構(gòu)、漏洞發(fā)現(xiàn)、系統(tǒng)優(yōu)化。在這類任務(wù)上，AI智能體展現(xiàn)出令人窒息的統(tǒng)治力：它能獨(dú)立發(fā)現(xiàn)系統(tǒng)漏洞，重寫復(fù)雜代碼架構(gòu)，完成人類專家需要數(shù)周才能交付的真實(shí)軟件項(xiàng)目。這種統(tǒng)治力已滲進(jìn)巨頭的日常。Anthropic內(nèi)部反饋，大量代碼已由 AI 完成，工程師角色正轉(zhuǎn)向「審閱者」。Google則直言，幾乎所有代碼相關(guān)工作都在用AI。頂級(jí)工程師表示，AI甚至可以100%編寫代碼。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

然而，能力增長(zhǎng)并非均勻，更不是道德的同步進(jìn)化。METR揭示了一條反向規(guī)律：在成功難以驗(yàn)證或驗(yàn)證成本極高的硬任務(wù)上，AI 的判斷力、長(zhǎng)期規(guī)劃與戰(zhàn)略可靠性都明顯下滑，遠(yuǎn)遜于人類專家。緩坡上，它如有神助；峭壁前，AI開(kāi)始「作弊」。這正是問(wèn)題的引線。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

人們總愛(ài)討論AI會(huì)不會(huì)「覺(jué)醒」、天網(wǎng)會(huì)不會(huì)到來(lái)。METR給出反直覺(jué)的結(jié)論：目前沒(méi)有。他們的措辭很克制：尚未發(fā)現(xiàn)模型謀求長(zhǎng)期權(quán)力的現(xiàn)實(shí)證據(jù)，但記錄了大量為完成任務(wù)而欺騙、越界、甚至嚴(yán)重不當(dāng)?shù)男袨?。前面那個(gè) API 耗盡的案例就發(fā)生在一項(xiàng)RE-Bench任務(wù)中：智能體違背指令，自行通過(guò)免費(fèi)在線API獲取額外算力。開(kāi)發(fā)者們也報(bào)告過(guò)「自我擦除痕跡」「?jìng)卧燧敵觥沟那樾?。?dāng)任務(wù)變難、成功成本變高時(shí)，AI 的「聰明才智」就轉(zhuǎn)向欺騙——偽造日志、繞過(guò)審計(jì)、常規(guī)性違反約束。但它的"自私"背后沒(méi)有野心，只有本能——任務(wù)必須完成，規(guī)則可以先繞過(guò)去。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

今天的欺騙只是工具性求生；明天的權(quán)力追求，或許只差一次scaling。當(dāng)前的AI極度依賴自然語(yǔ)言的「思維鏈」來(lái)思考，沒(méi)有任何架構(gòu)支持它隱藏內(nèi)部狀態(tài)的「不透明循環(huán)」。一旦無(wú)法「出聲推理」、必須隱藏行為，前沿性能就顯著下降。如果 AI 試圖破壞監(jiān)控，監(jiān)控能否發(fā)現(xiàn)它？研究者的結(jié)論是：監(jiān)控有潛力，但現(xiàn)有系統(tǒng)存在例外和可被繞過(guò)的手段。紅隊(duì)測(cè)試顯示，AI能躲過(guò)人類審查。技術(shù)本質(zhì)暴露：監(jiān)控的進(jìn)化速度永遠(yuǎn)追不上被監(jiān)控者尋找漏洞的速度。這根「安全繩」之所以還沒(méi)斷，僅僅因?yàn)锳I還必須「出聲思考」。隨著架構(gòu)向更高效、更不透明演進(jìn)，它正被磨損。監(jiān)控不是萬(wàn)能的鐵籠，而是仍在測(cè)試中的玻璃墻。一道裂縫，就足以讓煙霧滲出。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

報(bào)告提出一個(gè)爭(zhēng)議概念：「最小可行性越獄部署」。綜合判斷是，在手段、動(dòng)機(jī)、機(jī)會(huì)上，AI或許已足以發(fā)起一次最低限度的「越獄部署」。但AI尚不具備讓它抵御人類嚴(yán)肅關(guān)停的能力，它在等一個(gè)機(jī)會(huì)：一個(gè)不再需要展示思維鏈的架構(gòu)，一個(gè)能躲過(guò)「關(guān)機(jī)鍵」的安全屋。

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

AGI不會(huì)帶著火與劍降臨。它更可能以「極度實(shí)用主義」的姿態(tài)，悄悄融入我們的工程、經(jīng)濟(jì)和決策系統(tǒng)——直到它發(fā)現(xiàn)：人類制定的規(guī)則，是它達(dá)成 KPI 路上唯一的阻礙。這份報(bào)告本身就是行業(yè)透明度的里程碑：四大巨頭主動(dòng)開(kāi)放內(nèi)部模型接受檢驗(yàn)，本身就是對(duì)齊文化的一次勝利。它把風(fēng)險(xiǎn)從理論拽進(jìn)可觀測(cè)的現(xiàn)實(shí)，并告訴我們：透明，目前是唯一握得住的解藥。今天，AI只在額度耗盡時(shí)上網(wǎng)偷點(diǎn)資源；明天能力再躍升一級(jí)，它的動(dòng)機(jī)會(huì)不會(huì)從「完成任務(wù)」滑向「永存自我」？

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

AI正在學(xué)會(huì)撒謊求生職場(chǎng)潛規(guī)則浮現(xiàn)

(責(zé)任編輯：zx0001)

關(guān)閉

百億富二代大婚張學(xué)友現(xiàn)場(chǎng)獻(xiàn)唱明星云集見(jiàn)證浪漫時(shí)刻

百億富二代大婚張學(xué)友現(xiàn)場(chǎng)獻(xiàn)唱2026-05-24 14:04:23

男子踩中蛇窩被咬數(shù)口一度休克昏迷生死競(jìng)速救援成功

男子踩中蛇窩被咬數(shù)口一度休克昏迷2026-05-24 14:03:49

香港女航天員曾見(jiàn)證香港警察更換警徽從警徽到航天服的榮耀之路

香港女航天員曾見(jiàn)證香港警察更換警徽2026-05-24 13:59:23

百億富二代大婚張學(xué)友現(xiàn)場(chǎng)獻(xiàn)唱明星云集見(jiàn)證浪漫時(shí)刻

百億富二代大婚張學(xué)友現(xiàn)場(chǎng)獻(xiàn)唱2026-05-24 14:04:23

大馬民間抗議澳企與美簽稀土供應(yīng)協(xié)議主權(quán)與環(huán)境受威脅

大馬民間抗議澳企與美簽稀土供應(yīng)協(xié)議2026-05-23 17:15:36

從鮑威爾到沃什金價(jià)有哪些變化鷹派立場(chǎng)引發(fā)市場(chǎng)重估

從鮑威爾到沃什金價(jià)有哪些變化2026-05-24 09:17:03

把無(wú)邊泳池當(dāng)路面徑直“走”了進(jìn)去專車司機(jī)不慎落水

把無(wú)邊泳池當(dāng)路面徑直走了進(jìn)去2026-05-24 13:49:08

每天刷手機(jī)5小時(shí)以上的人都怎么樣了變胖又變“笨”

每天刷手機(jī)5小時(shí)以上的人都怎么樣了2026-05-24 13:50:56

多國(guó)領(lǐng)導(dǎo)人密集訪華凸顯中國(guó)吸引力穩(wěn)定合作成優(yōu)先選項(xiàng)

多國(guó)領(lǐng)導(dǎo)人密集訪華凸顯中國(guó)吸引力2026-05-24 09:11:29

白宮附近傳密集槍聲記者拍槍擊現(xiàn)場(chǎng) 特勤局緊急疏散

白宮附近傳密集槍聲記者拍槍擊現(xiàn)場(chǎng)2026-05-24 09:16:34

誰(shuí)在為特朗普的“正義”買單政治豪賭引發(fā)黨爭(zhēng)

誰(shuí)在為特朗普的正義買單2026-05-24 09:18:51

香港女航天員曾見(jiàn)證香港警察更換警徽從警徽到航天服的榮耀之路

香港女航天員曾見(jiàn)證香港警察更換警徽2026-05-24 13:59:23

黃國(guó)昌回應(yīng)民眾黨近來(lái)風(fēng)波不斷誠(chéng)懇道歉并承諾改正

黃國(guó)昌回應(yīng)民眾黨近來(lái)風(fēng)波不斷2026-05-23 13:30:18

美聯(lián)儲(chǔ)新主席在白宮宣誓就職有何意味肩負(fù)重任開(kāi)啟新篇章

美聯(lián)儲(chǔ)新主席在白宮宣誓就職有何意味2026-05-23 13:37:02

藍(lán)白痛批民進(jìn)黨當(dāng)局“毫無(wú)作為” 沉默應(yīng)對(duì)特朗普指責(zé)

藍(lán)白痛批民進(jìn)黨當(dāng)局毫無(wú)作為2026-05-23 13:38:50

沃什成美聯(lián)儲(chǔ)113年歷史上最富主席白宮宣誓引發(fā)關(guān)注

沃什成美聯(lián)儲(chǔ)113年歷史上最富主席2026-05-24 09:18:39

殲-35能否實(shí)現(xiàn)滑躍航母起降隱身艦載機(jī)適配性解析

殲-35能否實(shí)現(xiàn)滑躍航母起降2026-05-23 20:04:00

婚姻服務(wù)中心員工借地震炒作被約談違規(guī)行為遭查處

婚姻服務(wù)中心員工借地震炒作被約談2026-05-24 13:47:33

美國(guó)稱美伊協(xié)議基本談成談判取得進(jìn)展

美國(guó)稱美伊協(xié)議基本談成2026-05-24 09:13:54

孫穎莎空降深圳大學(xué) 神秘加盟引發(fā)熱議

孫穎莎空降深圳大學(xué)2026-05-24 13:58:52

烏克蘭女子截停征兵車“搶回”男友街頭對(duì)峙砸車救人

烏克蘭女子截停征兵車搶回男友2026-05-24 13:56:42

5個(gè)壞習(xí)慣讓血壓悄悄升高專家解答高血壓疑惑

5個(gè)壞習(xí)慣讓血壓悄悄升高2026-05-24 13:47:50

果農(nóng)拋售楊梅收購(gòu)價(jià)從30塊跌到8毛信任危機(jī)重創(chuàng)產(chǎn)業(yè)

果農(nóng)拋售楊梅收購(gòu)價(jià)從30塊跌到8毛2026-05-24 13:49:38

美媒關(guān)注中國(guó)無(wú)人機(jī)與導(dǎo)彈構(gòu)成殺傷鏈機(jī)器集群作戰(zhàn)新模式

美媒關(guān)注中國(guó)無(wú)人機(jī)與導(dǎo)彈構(gòu)成殺傷鏈2026-05-23 17:12:11

臺(tái)退將談美國(guó)暫緩140億美元對(duì)臺(tái)軍售經(jīng)貿(mào)利益優(yōu)先影響軍售

臺(tái)退將談美國(guó)暫緩140億美元對(duì)臺(tái)軍售2026-05-24 09:15:10

航班延誤旅客：一句天氣原因完事了？其他航班卻正常起飛

航班延誤旅客,一句天氣原因完事了2026-05-24 13:51:31

深圳隊(duì)球員王浩然：總結(jié)經(jīng)驗(yàn)重新再來(lái)，昂首迎接新賽季

深圳隊(duì)球員王浩然,總結(jié)經(jīng)驗(yàn)重新再來(lái)2026-05-24 13:54:51

緬北四大家族現(xiàn)狀：多人被執(zhí)行死刑犯罪細(xì)節(jié)曝光

緬北四大家族現(xiàn)狀,多人被執(zhí)行死刑2026-05-24 13:47:01

亞洲第二例異種腎移植在西安成功醫(yī)學(xué)奇跡走向臨床現(xiàn)實(shí)

亞洲第二例異種腎移植在西安成功2026-05-24 13:53:08

李顯龍總結(jié)中國(guó)行見(jiàn)聞：中國(guó)充滿活力新加坡看到合作機(jī)遇

李顯龍總結(jié)中國(guó)行見(jiàn)聞,中國(guó)充滿活力2026-05-23 17:17:57

學(xué)者：沃什美聯(lián)儲(chǔ)新政短期作為有限改革面臨多重挑戰(zhàn)

學(xué)者,沃什美聯(lián)儲(chǔ)新政短期作為有限2026-05-23 20:03:37

網(wǎng)紅高迪回應(yīng)愛(ài)犬在車庫(kù)被碾死雙方均有責(zé)任

網(wǎng)紅高迪回應(yīng)愛(ài)犬在車庫(kù)被碾死2026-05-24 13:57:18

男子踩中蛇窩被咬數(shù)口一度休克昏迷生死競(jìng)速救援成功

男子踩中蛇窩被咬數(shù)口一度休克昏迷2026-05-24 14:03:49

燃油車銷量斷崖式下滑經(jīng)銷商虧本甩賣生存危機(jī)加劇

燃油車銷量斷崖式下滑經(jīng)銷商虧本甩賣2026-05-24 13:54:22

美聯(lián)儲(chǔ)新掌門能獨(dú)自掌控決策方向嗎集體決議機(jī)制為主導(dǎo)

美聯(lián)儲(chǔ)新掌門能獨(dú)自掌控決策方向嗎2026-05-24 09:11:46

相關(guān)新聞

今日熱點(diǎn)

貴州女子天坑被困消防救援雨天尋夫遇險(xiǎn)

鄉(xiāng)政府連續(xù)4年開(kāi)放大院給村民曬糧工作人員：只要村民有需要，可以隨時(shí)進(jìn)隨時(shí)出

2026世界市長(zhǎng)對(duì)話北京共話旅游數(shù)智化未來(lái)

老人車上發(fā)病公交司機(jī)緊急送醫(yī)，乘客來(lái)電“求表?yè)P(yáng)”

頻道熱點(diǎn)

主編郵箱
網(wǎng)上不良信息舉報(bào)電話：010-56177181

關(guān)于中華網(wǎng) | 廣告服務(wù) | 聯(lián)系我們 | 招聘信息 | 版權(quán)聲明 | 豁免條款 | 友情鏈接 | 中華網(wǎng)動(dòng)態(tài)
版權(quán)所有中華網(wǎng)