电竞下注-中国电竞赛事及体育赛事平台

中華網(wǎng) china.com

Anthropic如何打造憲法式人工智能 安全至上的理念

關(guān)鍵詞:
2026-03-31 17:52:02  礪石商業(yè)評論

2026年2月,硅谷發(fā)生了兩件令人震驚的新聞。Anthropic的安全負(fù)責(zé)人突然辭職,并警告“世界處于危險(xiǎn)之中”。幾乎同時(shí),五角大樓要求該公司解除其王牌模型Claude的核心安全限制,但遭到拒絕。這兩件事從不同方向拉扯著名為“AI安全”的韁繩,而這正是Anthropic存在的全部理由。

時(shí)間倒回2021年,出于對AI失控的深切恐懼,前OpenAI高管達(dá)里奧·阿莫迪與負(fù)責(zé)安全政策的妹妹丹妮拉帶領(lǐng)七名同事出走,創(chuàng)立了Anthropic。他們的核心命題只有一個(gè):如何控制比人類更聰明的AI。短短四年間,公司估值飆升至3800億美元,客戶名單囊括全球頂級企業(yè)。然而,國家力量的介入使這家曾經(jīng)為防范風(fēng)險(xiǎn)而生的公司陷入自設(shè)的困局。

達(dá)里奧和丹妮拉出生于一個(gè)意大利裔家庭,父親是一位精通各類皮料的工匠,母親在圖書館工作。兄妹二人自幼成績優(yōu)異,畢業(yè)后卻走上截然不同的人生道路。達(dá)里奧早年就讀于加州理工,中途轉(zhuǎn)至斯坦福取得物理學(xué)學(xué)士學(xué)位,隨后在普林斯頓獲得生物物理學(xué)博士學(xué)位。他最初的研究與AI無關(guān),直到2013年前后,隨著深度學(xué)習(xí)浪潮興起,他憑借頂尖的學(xué)術(shù)背景加入百度參與Deep Speech 2.0語音識別項(xiàng)目,隨后轉(zhuǎn)投Google Brain,確立了自己在AI領(lǐng)域的核心方向。

相比之下,丹妮拉的發(fā)展更為非典型。她憑借古典長笛獎(jiǎng)學(xué)金,在加州大學(xué)圣克魯茲分校攻讀英語文學(xué)學(xué)位,畢業(yè)后進(jìn)入公共事務(wù)領(lǐng)域,積累了豐富的實(shí)戰(zhàn)經(jīng)驗(yàn)。隨后她轉(zhuǎn)向科技行業(yè),成為金融科技公司Stripe的早期員工。外界這樣概括兄妹倆的角色:達(dá)里奧猶如眺望地平線的“望遠(yuǎn)鏡”,丹妮拉則是夯實(shí)地基的“建筑師”。

2016年,達(dá)里奧離開Google Brain加入OpenAI,妹妹丹妮拉于2018年跟隨而來。接下來的五年,達(dá)里奧主導(dǎo)了GPT-2和GPT-3的開發(fā),成為技術(shù)方向上最有分量的人之一。然而,隨著GPT-3的開發(fā),裂痕開始公開化。達(dá)里奧認(rèn)為必須放慢更新速度以防止惡意使用,而奧特曼則主張快速迭代、盡快商業(yè)化。最終,達(dá)里奧與妹妹丹妮拉及其他七人離開OpenAI,成立了Anthropic。

Anthropic成立之初,被質(zhì)疑最多的是與OpenAI有何不同。兩者根本區(qū)別在于對人工智能構(gòu)建體系的排序。OpenAI選擇了“性能優(yōu)先,安全迭代”,而Anthropic則堅(jiān)持“安全第一,功能殿后”。這意味著當(dāng)用戶的請求與“不造成損害”的核心原則相沖突時(shí),Anthropic的模型會啟動內(nèi)置的審查機(jī)制,選擇拒絕響應(yīng)。這種設(shè)計(jì)并不符合用戶期待,但也讓Anthropic得到了很多差評。然而,達(dá)里奧及團(tuán)隊(duì)并不在意,他們將這套邏輯做成了一個(gè)叫“Constitutional AI”的方法論,即通過創(chuàng)造一套明確的價(jià)值觀原則,讓AI用這套原則評判和修正自己的輸出。

Anthropic的成功在于精準(zhǔn)押注企業(yè)級市場,而非個(gè)人用戶。創(chuàng)立僅四年時(shí)間,近80%的收入來源于企業(yè)客戶。在《財(cái)富》全球500強(qiáng)中排名前十的巨頭里,有八家已是Claude的付費(fèi)用戶。這些企業(yè)需要一個(gè)能無縫嵌入核心業(yè)務(wù)流程、行為絕對可預(yù)測、輸出極端穩(wěn)定、權(quán)責(zé)清晰無誤的“專業(yè)工具”。Anthropic將這種“可信”的承諾轉(zhuǎn)化為可被精確度量與驗(yàn)證的性能指標(biāo)。例如,在衡量AI“虛構(gòu)事實(shí)”傾向的核心測試中,Claude 3.5 Sonnet的表現(xiàn)顯著優(yōu)于行業(yè)基準(zhǔn)GPT-4。

然而,商業(yè)擴(kuò)張的壓力逐漸壓過了Anthropic曾經(jīng)倡導(dǎo)的“安全至上”初心。2026年2月9日,Anthropic的安全負(fù)責(zé)人Sharma辭職離任,留下一句簡短卻沉重的警告:“世界處于危險(xiǎn)之中?!迸c此同時(shí),公司官網(wǎng)上的“安全承諾”被悄然修改,替換為一個(gè)更溫和的表述:“風(fēng)險(xiǎn)報(bào)告”。這表明在商業(yè)目標(biāo)面前,Anthropic曾經(jīng)堅(jiān)守的安全原則防線可能已經(jīng)出現(xiàn)松動。

對于Anthropic來說,眼下更深層的困境正逐步浮現(xiàn):自身所依賴的那部“AI憲法”,其核心原則究竟交由誰來定義?面對這種關(guān)于“度”的永恒爭議,很難得到真正的答案。達(dá)里奧與丹妮拉選擇了躍入潮水之中,并試圖在洪流里拉起一道繩索,目的是“讓AI知曉它不應(yīng)涉足的邊界”。這一切能否堅(jiān)持下去,無人知曉,一切依然需要時(shí)間的檢驗(yàn)。

(責(zé)任編輯:0764)
關(guān)閉

“寧王”股價(jià)逼近歷史新高 鋰電板塊熱度激增

寧王股價(jià)逼近歷史新高2026-04-29 20:10:55

競拍者悔拍別墅血虧758萬保證金 巨額損失引熱議

競拍者悔拍別墅血虧758萬保證金2026-04-29 20:06:00

傅聰:以色列必須停止非法定居點(diǎn)活動 呼吁堅(jiān)持“兩國方案”

傅聰,以色列必須停止非法定居點(diǎn)活動2026-04-29 20:05:28

建成30年首次大修,北京西站有何新變化?煥新顏提效率

建成30年首次大修,北京西站有何新變化2026-04-29 19:33:50

一公司虛構(gòu)大廠裁員引流賣課被判賠 虛假宣傳誤導(dǎo)消費(fèi)者

一公司虛構(gòu)大廠裁員引流賣課被判賠2026-04-29 19:39:29

美國廣播公司主持人再次激怒特朗普 深夜脫口秀惹爭議

美國廣播公司主持人再次激怒特朗普2026-04-29 19:41:44

菲律賓防長咋呼:美國稍不留神,中國就插一腳 南海局勢再起波瀾

菲律賓防長咋呼,美國稍不留神,中國就插一腳2026-04-29 15:04:16

國臺辦算清臺灣統(tǒng)一后的經(jīng)濟(jì)賬 和平統(tǒng)一帶來空前良機(jī)

國臺辦算清臺灣統(tǒng)一后的經(jīng)濟(jì)賬2026-04-29 16:54:38

伊朗強(qiáng)硬不接套路 反制美國股市操縱

伊朗強(qiáng)硬不接套路2026-04-29 15:14:45

HIV怎么從黑猩猩傳播到人類的?這個(gè)其實(shí)有大量研究了

HIV怎么從黑猩猩傳播到人類的2026-04-29 19:44:30

伊朗男孩重回中國上學(xué)全班緊緊抱住 戰(zhàn)火后的溫暖重逢

伊朗男孩重回中國上學(xué)全班緊緊抱住2026-04-29 15:00:03

黃金徹底漲不動了?黃金牛市真的結(jié)束了嗎

影響金價(jià)的關(guān)鍵因素是什么2026-04-29 17:40:10

上市公司走私上千噸管制石墨至美國 戰(zhàn)略資源流失引警惕

上市公司走私上千噸管制石墨至美國2026-04-29 19:47:10

行車發(fā)生糾紛,下車上演全武行,男子赤手抱摔持械男子

男子因行車糾紛赤手抱摔男子2026-04-29 19:58:06

聚光燈照不到的“張雪”們

媒體,聚光燈照不到的張雪們2026-04-29 19:58:37

英國國王給特朗普送了一口鐘 特殊禮物傳遞心意

英國國王給特朗普送了一口鐘2026-04-29 17:29:17

男子請假10天做了5臺手術(shù)直呼后悔 勇氣可嘉但痛苦難忘

男子請假10天做了5臺手術(shù)直呼后悔2026-04-29 19:55:25

博主用給跪了表情包11年后被索賠1萬 合理使用仍遭訴

博主用給跪了表情包11年后被索賠1萬2026-04-29 19:49:41

競拍者悔拍別墅血虧758萬保證金 巨額損失引熱議

競拍者悔拍別墅血虧758萬保證金2026-04-29 20:06:00

俄羅斯能守住對薩赫勒三國的影響嗎?

俄羅斯能守住對薩赫勒三國的影響嗎2026-04-29 17:20:32

評論員:日本軍事暴走正全面提速

評論員:日本軍事暴走正全面提速2026-04-29 17:37:37

轉(zhuǎn)走儲戶1800萬銀行員工喝藥輕生 存款失蹤之謎待解

轉(zhuǎn)走儲戶1800萬銀行員工喝藥輕生2026-04-29 20:02:34

慶陽南佐遺址揭秘最早都邑中軸線布局 五千年前文明印記

慶陽南佐遺址揭秘最早都邑中軸線布局2026-04-29 20:00:03

白宮:特朗普與高級幕僚討論伊朗提出的霍爾木茲海峽提議 提議細(xì)節(jié)曝光

白宮,特朗普與高級幕僚討論伊朗提出的霍爾木茲海峽提議2026-04-29 17:26:01

臺網(wǎng)友諷刺民進(jìn)黨禁的一定是好東西 高德地圖登頂下載榜

臺網(wǎng)友諷刺民進(jìn)黨禁的一定是好東西2026-04-29 15:07:46

職業(yè)閉店人的路走到頭了 合同詐騙被判刑

職業(yè)閉店人的路走到頭了2026-04-29 19:39:02

國臺辦回應(yīng)美花生或零關(guān)稅輸入臺灣 島內(nèi)憂慮“滅農(nóng)”沖擊

國臺辦回應(yīng)美花生或零關(guān)稅輸入臺灣2026-04-29 15:01:36

稀土永磁大漲原因 龍頭業(yè)績激增助推

稀土永磁大漲原因2026-04-29 17:23:39

阿聯(lián)酋退出歐佩克 黃金為何暴跌 能源卡特爾體系裂變

阿聯(lián)酋退出歐佩克黃金為何暴跌2026-04-29 15:19:26

中國軍號:日本打不起“長期戰(zhàn)爭” 資源貧瘠成致命弱點(diǎn)

中國軍號,日本打不起長期戰(zhàn)爭2026-04-29 16:56:30

“寧王”股價(jià)逼近歷史新高 鋰電板塊熱度激增

寧王股價(jià)逼近歷史新高2026-04-29 20:10:55

傅聰:以色列必須停止非法定居點(diǎn)活動 呼吁堅(jiān)持“兩國方案”

傅聰,以色列必須停止非法定居點(diǎn)活動2026-04-29 20:05:28

寧德時(shí)代年終獎(jiǎng)發(fā)放通知 剩余獎(jiǎng)金已發(fā)放

寧德時(shí)代年終獎(jiǎng)發(fā)放通知2026-04-29 17:28:46

相關(guān)新聞