AI安全的紅線在后退嗎商業(yè)博弈下的松綁

小大

用微信掃描二維碼
分享至好友和朋友圈

關(guān)鍵詞：

2026-02-28 12:22:35 創(chuàng)業(yè)家

AI安全的紅線在后退嗎商業(yè)博弈下的松綁。Anthropic最近悄悄改寫了其核心承諾。2月24日，該公司發(fā)布了《負(fù)責(zé)任擴(kuò)展政策》第三版（RSP 3.0），刪除了“模型觸及危險(xiǎn)閾值就暫停訓(xùn)練”的硬性規(guī)定，取而代之的是“透明披露”的柔性框架。與此同時(shí)，OpenAI在2024年度的IRS表格中也刪掉了使命陳述中的“safely”一詞。

這兩家全球頂尖AI公司的舉動(dòng)讓“AI安全”這個(gè)嚴(yán)肅話題蒙上了一層商業(yè)博弈的陰影。曾經(jīng)高舉“安全優(yōu)先”大旗的領(lǐng)航者為何在此時(shí)集體松綁？背后的原因是資本壓力、行業(yè)競(jìng)爭(zhēng)與監(jiān)管真空共同作用的結(jié)果，反映出AI行業(yè)發(fā)展的深層困境。

Anthropic的轉(zhuǎn)變尤為戲劇性。這家公司由前OpenAI核心成員創(chuàng)立，成立初衷是擔(dān)心AI失控，“安全”是其區(qū)別于其他公司的核心招牌。2023年版RSP政策中明確寫入了“if-then”約束機(jī)制：若無(wú)法部署對(duì)應(yīng)安全措施，就必須暫停訓(xùn)練更強(qiáng)模型。但在RSP 3.0中，這道鎖被換成了旋轉(zhuǎn)門。新框架以安全路線圖、風(fēng)險(xiǎn)報(bào)告和外部評(píng)審為核心，從“做不到就不許動(dòng)”變成了“邊做邊說(shuō)”。Anthropic解釋稱，AI安全級(jí)別越高，預(yù)設(shè)具體防護(hù)措施就越困難，模型能力是連續(xù)增長(zhǎng)的，不存在清晰的紅線。

然而，這一解釋并未解答外界的疑問(wèn)：如果邊界本就模糊，為何當(dāng)初要將其作為核心承諾？又為何偏偏在完成300億美元融資、估值升至3800億美元的節(jié)點(diǎn)修改？

答案或許藏在商業(yè)競(jìng)爭(zhēng)的現(xiàn)實(shí)里。Anthropic首席科學(xué)家Jared Kaplan直言：“如果競(jìng)爭(zhēng)對(duì)手飛速前進(jìn)，我們單方面承諾暫停訓(xùn)練沒(méi)有意義?！比缃竦腁I競(jìng)賽早已不是幾家公司的博弈，開源社區(qū)、各國(guó)企業(yè)都在加速推進(jìn)，沒(méi)有哪家愿意為了安全主動(dòng)放慢腳步。Anthropic曾設(shè)想由自己設(shè)立安全標(biāo)準(zhǔn)、帶動(dòng)行業(yè)跟進(jìn)，但多數(shù)公司的安全框架只是形式對(duì)標(biāo)，并非實(shí)質(zhì)約束。

OpenAI的動(dòng)作同樣耐人尋味。其舊使命“構(gòu)建安全的、造福全人類的通用人工智能”中，“safely”一詞是說(shuō)服外界的最后防線。但現(xiàn)在這個(gè)詞的消失讓人擔(dān)憂：當(dāng)估值沖向8300億美元，商業(yè)利益是否已凌駕于安全之上？

有人認(rèn)為刪改一個(gè)副詞是小題大做，但在AI行業(yè)，這種表述變化絕非偶然。兩家公司的默契調(diào)整本質(zhì)上是在資本壓力下的理性選擇：暫停訓(xùn)練意味著暫停產(chǎn)品迭代、商業(yè)落地和估值增長(zhǎng)，這對(duì)于背負(fù)巨大市值預(yù)期的商業(yè)實(shí)體而言，代價(jià)過(guò)于沉重。

更現(xiàn)實(shí)的是，當(dāng)前政治氣候?qū)I監(jiān)管不友好，政府行動(dòng)遲緩，企業(yè)不愿單方面承擔(dān)安全成本，這種監(jiān)管真空進(jìn)一步放大了行業(yè)的焦慮。Anthropic反復(fù)強(qiáng)調(diào)，RSP 3.0不是放棄安全，而是換了更成熟的方式。確實(shí)，新版本保留了不少實(shí)質(zhì)性安全機(jī)制，比如針對(duì)生化武器風(fēng)險(xiǎn)的ASL-3級(jí)別防護(hù)標(biāo)準(zhǔn)，通過(guò)輸入輸出分類器攔截濫用內(nèi)容。但問(wèn)題的核心在于，透明披露能否替代硬性約束？顯然不能。

硬性約束是“鎖死選項(xiàng)”，無(wú)論壓力多大都無(wú)路可退；而透明披露依賴外部輿論和內(nèi)部自律，當(dāng)資本焦慮足夠強(qiáng)烈，這種約束很可能形同虛設(shè)。2026年的AI行業(yè)，“安全”正逐漸變成一種公關(guān)語(yǔ)言——幾乎所有主流公司都有安全框架和負(fù)責(zé)任政策，但這些文件究竟是用來(lái)約束自己，還是用來(lái)安撫監(jiān)管和公眾？

更令人擔(dān)憂的是，企業(yè)有權(quán)自行修改安全框架，安全承諾的邊界正在不斷移動(dòng)。Anthropic最初的設(shè)想是，企業(yè)率先設(shè)立標(biāo)準(zhǔn)，推動(dòng)行業(yè)自律，最終形成政府多邊協(xié)調(diào)機(jī)制。但這條路并未走通：監(jiān)管跟不上技術(shù)和商業(yè)的變化，安全共識(shí)逐漸散開，競(jìng)爭(zhēng)卻在持續(xù)加速，形成了“沒(méi)人愿意踩剎車”的行業(yè)現(xiàn)狀。

在這個(gè)監(jiān)管真空期，一個(gè)關(guān)鍵問(wèn)題浮出水面：如果企業(yè)不再為自己設(shè)紅線，誰(shuí)來(lái)設(shè)？AI技術(shù)的發(fā)展速度遠(yuǎn)超想象，其潛在風(fēng)險(xiǎn)也在不斷升級(jí)，從協(xié)助生物武器研發(fā)到引發(fā)就業(yè)危機(jī)，都可能成為現(xiàn)實(shí)。僅靠企業(yè)自律和透明披露，顯然無(wú)法應(yīng)對(duì)這些系統(tǒng)性風(fēng)險(xiǎn)。

我們必須清醒地認(rèn)識(shí)到，AI安全不能依賴企業(yè)的道德自覺(jué)，更需要制度性保障。當(dāng)行業(yè)競(jìng)爭(zhēng)進(jìn)入白熱化，資本回報(bào)的誘惑越來(lái)越大，只有建立統(tǒng)一的行業(yè)標(biāo)準(zhǔn)、完善的監(jiān)管體系和有效的多邊協(xié)調(diào)機(jī)制，才能為AI發(fā)展劃定真正的紅線。

Anthropic和OpenAI的安全承諾調(diào)整給整個(gè)行業(yè)敲響了警鐘。AI的終極目標(biāo)是造福人類，而安全是實(shí)現(xiàn)這一目標(biāo)的前提。如果為了追求速度和商業(yè)利益不斷后退安全底線，最終可能讓整個(gè)行業(yè)陷入信任危機(jī)。當(dāng)下最需要的是政府、企業(yè)、科研機(jī)構(gòu)的協(xié)同行動(dòng)：盡快建立清晰的AI安全標(biāo)準(zhǔn)，完善監(jiān)管政策，讓安全成本由全行業(yè)共同承擔(dān)，而非單個(gè)企業(yè)獨(dú)自扛下。只有這樣，才能避免AI行業(yè)在“比誰(shuí)更快”的競(jìng)賽中失控，讓技術(shù)發(fā)展真正走上可持續(xù)的軌道。否則，當(dāng)所有玩家都在加速，沒(méi)有剎車的賽道終將通向未知的危險(xiǎn)。

(責(zé)任編輯：0882)

關(guān)閉

AI安全的紅線在后退嗎 商業(yè)博弈下的松綁

相關(guān)新聞

今日熱點(diǎn)

頻道熱點(diǎn)

AI安全的紅線在后退嗎商業(yè)博弈下的松綁