AI安全的紅線在后退嗎 商業(yè)博弈下的松綁。Anthropic最近悄悄改寫了其核心承諾。2月24日,該公司發(fā)布了《負(fù)責(zé)任擴(kuò)展政策》第三版(RSP 3.0),刪除了“模型觸及危險(xiǎn)閾值就暫停訓(xùn)練”的硬性規(guī)定,取而代之的是“透明披露”的柔性框架。與此同時(shí),OpenAI在2024年度的IRS表格中也刪掉了使命陳述中的“safely”一詞。
這兩家全球頂尖AI公司的舉動(dòng)讓“AI安全”這個(gè)嚴(yán)肅話題蒙上了一層商業(yè)博弈的陰影。曾經(jīng)高舉“安全優(yōu)先”大旗的領(lǐng)航者為何在此時(shí)集體松綁?背后的原因是資本壓力、行業(yè)競(jìng)爭(zhēng)與監(jiān)管真空共同作用的結(jié)果,反映出AI行業(yè)發(fā)展的深層困境。
Anthropic的轉(zhuǎn)變尤為戲劇性。這家公司由前OpenAI核心成員創(chuàng)立,成立初衷是擔(dān)心AI失控,“安全”是其區(qū)別于其他公司的核心招牌。2023年版RSP政策中明確寫入了“if-then”約束機(jī)制:若無(wú)法部署對(duì)應(yīng)安全措施,就必須暫停訓(xùn)練更強(qiáng)模型。但在RSP 3.0中,這道鎖被換成了旋轉(zhuǎn)門。新框架以安全路線圖、風(fēng)險(xiǎn)報(bào)告和外部評(píng)審為核心,從“做不到就不許動(dòng)”變成了“邊做邊說(shuō)”。Anthropic解釋稱,AI安全級(jí)別越高,預(yù)設(shè)具體防護(hù)措施就越困難,模型能力是連續(xù)增長(zhǎng)的,不存在清晰的紅線。
然而,這一解釋并未解答外界的疑問(wèn):如果邊界本就模糊,為何當(dāng)初要將其作為核心承諾?又為何偏偏在完成300億美元融資、估值升至3800億美元的節(jié)點(diǎn)修改?
答案或許藏在商業(yè)競(jìng)爭(zhēng)的現(xiàn)實(shí)里。Anthropic首席科學(xué)家Jared Kaplan直言:“如果競(jìng)爭(zhēng)對(duì)手飛速前進(jìn),我們單方面承諾暫停訓(xùn)練沒(méi)有意義?!比缃竦腁I競(jìng)賽早已不是幾家公司的博弈,開源社區(qū)、各國(guó)企業(yè)都在加速推進(jìn),沒(méi)有哪家愿意為了安全主動(dòng)放慢腳步。Anthropic曾設(shè)想由自己設(shè)立安全標(biāo)準(zhǔn)、帶動(dòng)行業(yè)跟進(jìn),但多數(shù)公司的安全框架只是形式對(duì)標(biāo),并非實(shí)質(zhì)約束。
OpenAI的動(dòng)作同樣耐人尋味。其舊使命“構(gòu)建安全的、造福全人類的通用人工智能”中,“safely”一詞是說(shuō)服外界的最后防線。但現(xiàn)在這個(gè)詞的消失讓人擔(dān)憂:當(dāng)估值沖向8300億美元,商業(yè)利益是否已凌駕于安全之上?
有人認(rèn)為刪改一個(gè)副詞是小題大做,但在AI行業(yè),這種表述變化絕非偶然。兩家公司的默契調(diào)整本質(zhì)上是在資本壓力下的理性選擇:暫停訓(xùn)練意味著暫停產(chǎn)品迭代、商業(yè)落地和估值增長(zhǎng),這對(duì)于背負(fù)巨大市值預(yù)期的商業(yè)實(shí)體而言,代價(jià)過(guò)于沉重。
更現(xiàn)實(shí)的是,當(dāng)前政治氣候?qū)I監(jiān)管不友好,政府行動(dòng)遲緩,企業(yè)不愿單方面承擔(dān)安全成本,這種監(jiān)管真空進(jìn)一步放大了行業(yè)的焦慮。Anthropic反復(fù)強(qiáng)調(diào),RSP 3.0不是放棄安全,而是換了更成熟的方式。確實(shí),新版本保留了不少實(shí)質(zhì)性安全機(jī)制,比如針對(duì)生化武器風(fēng)險(xiǎn)的ASL-3級(jí)別防護(hù)標(biāo)準(zhǔn),通過(guò)輸入輸出分類器攔截濫用內(nèi)容。但問(wèn)題的核心在于,透明披露能否替代硬性約束?顯然不能。
硬性約束是“鎖死選項(xiàng)”,無(wú)論壓力多大都無(wú)路可退;而透明披露依賴外部輿論和內(nèi)部自律,當(dāng)資本焦慮足夠強(qiáng)烈,這種約束很可能形同虛設(shè)。2026年的AI行業(yè),“安全”正逐漸變成一種公關(guān)語(yǔ)言——幾乎所有主流公司都有安全框架和負(fù)責(zé)任政策,但這些文件究竟是用來(lái)約束自己,還是用來(lái)安撫監(jiān)管和公眾?
更令人擔(dān)憂的是,企業(yè)有權(quán)自行修改安全框架,安全承諾的邊界正在不斷移動(dòng)。Anthropic最初的設(shè)想是,企業(yè)率先設(shè)立標(biāo)準(zhǔn),推動(dòng)行業(yè)自律,最終形成政府多邊協(xié)調(diào)機(jī)制。但這條路并未走通:監(jiān)管跟不上技術(shù)和商業(yè)的變化,安全共識(shí)逐漸散開,競(jìng)爭(zhēng)卻在持續(xù)加速,形成了“沒(méi)人愿意踩剎車”的行業(yè)現(xiàn)狀。
在這個(gè)監(jiān)管真空期,一個(gè)關(guān)鍵問(wèn)題浮出水面:如果企業(yè)不再為自己設(shè)紅線,誰(shuí)來(lái)設(shè)?AI技術(shù)的發(fā)展速度遠(yuǎn)超想象,其潛在風(fēng)險(xiǎn)也在不斷升級(jí),從協(xié)助生物武器研發(fā)到引發(fā)就業(yè)危機(jī),都可能成為現(xiàn)實(shí)。僅靠企業(yè)自律和透明披露,顯然無(wú)法應(yīng)對(duì)這些系統(tǒng)性風(fēng)險(xiǎn)。
我們必須清醒地認(rèn)識(shí)到,AI安全不能依賴企業(yè)的道德自覺(jué),更需要制度性保障。當(dāng)行業(yè)競(jìng)爭(zhēng)進(jìn)入白熱化,資本回報(bào)的誘惑越來(lái)越大,只有建立統(tǒng)一的行業(yè)標(biāo)準(zhǔn)、完善的監(jiān)管體系和有效的多邊協(xié)調(diào)機(jī)制,才能為AI發(fā)展劃定真正的紅線。
Anthropic和OpenAI的安全承諾調(diào)整給整個(gè)行業(yè)敲響了警鐘。AI的終極目標(biāo)是造福人類,而安全是實(shí)現(xiàn)這一目標(biāo)的前提。如果為了追求速度和商業(yè)利益不斷后退安全底線,最終可能讓整個(gè)行業(yè)陷入信任危機(jī)。當(dāng)下最需要的是政府、企業(yè)、科研機(jī)構(gòu)的協(xié)同行動(dòng):盡快建立清晰的AI安全標(biāo)準(zhǔn),完善監(jiān)管政策,讓安全成本由全行業(yè)共同承擔(dān),而非單個(gè)企業(yè)獨(dú)自扛下。只有這樣,才能避免AI行業(yè)在“比誰(shuí)更快”的競(jìng)賽中失控,讓技術(shù)發(fā)展真正走上可持續(xù)的軌道。否則,當(dāng)所有玩家都在加速,沒(méi)有剎車的賽道終將通向未知的危險(xiǎn)。
近日,“雙十一”熱潮剛過(guò),不少電商賣家發(fā)現(xiàn)一些消費(fèi)者利用AI工具制作虛假圖片來(lái)騙取退款。這種行為不僅涉及民事欺詐,還可能觸犯行政和刑事法律
2025-11-18 09:02:08濫用AI薅羊毛是在觸碰法律紅線DeepSeek當(dāng)選網(wǎng)易有道詞典2025年度詞匯,全年搜索量超867萬(wàn)次新榜訊 12月1日,網(wǎng)易有道詞典正式揭曉2025年度詞匯為“DeepSeek”
2025-12-01 15:00:48羅永浩洪女士夫妻倆在杭州開了一家沙縣小吃,說(shuō)是房東去年要求提前解約,當(dāng)時(shí)還談好了賠償。但拖了半年,賠償沒(méi)見到,連租金和押金都沒(méi)退。...
2026-03-18 18:27:05沙縣小吃撤場(chǎng)后退錢卡殼我發(fā)現(xiàn)被AI馴化的人有個(gè)特點(diǎn),看到稍微長(zhǎng)一點(diǎn)的文本,就會(huì)懷疑這是不是AI寫的,并本能地想讓AI來(lái)做總結(jié)
2026-03-26 09:56:37你在用AI寫文章嗎