电竞下注-中国电竞赛事及体育赛事平台

中華網 china.com

罕見!“AI巨頭”Anthropic呼吁全球暫停AI開發(fā),警告模型正逐步具備“自我升級”能力

關鍵詞:
2026-06-05 10:29:24  新浪

罕見!“AI巨頭”Anthropic呼吁全球暫停AI開發(fā),警告模型正逐步具備“自我升級”能力!一家估值接近萬億美元、正沖刺IPO的AI公司,突然公開呼吁全球暫停AI開發(fā)。

6月4日,Anthropic在官方博客發(fā)布了一篇題為《當AI構建自身》(When AI Builds Itself)的長文。文章由公司聯(lián)合創(chuàng)始人Jack Clark和內部研究機構負責人Marina Favaro聯(lián)合署名,首次罕見對外披露了一批此前從未公開的內部運營數(shù)據(jù)。

這些數(shù)據(jù)顯示,AI正在以驚人速度加速AI自身的開發(fā)進程:截至2026年5月,Anthropic超過80%合并入代碼庫的代碼由Claude撰寫;與2024年相比,工程師每日合并代碼量已增長8倍;在一項內部研究調查中,員工估計使用最新模型Mythos Preview后,自身產出約為不使用任何AI工具時的4倍。

更關鍵的是,Anthropic提出了一個令整個AI行業(yè)不安的概念警示:“遞歸自我改進”(recursive self-improvement)——即AI系統(tǒng)無需人類干預、自主設計并改進其繼任者的能力。這一階段尚未到來,但“可能在未來兩年內發(fā)生,甚至更早”。

根據(jù)這些數(shù)據(jù),Anthropic提出一個在AI行業(yè)頗為罕見的主張:全球應協(xié)調考慮暫停或放緩前沿AI的開發(fā)。在業(yè)務高速擴張之際,Anthropic卻主動呼吁“踩剎車”——這一反常舉動,正在華爾街和硅谷同時引發(fā)爭議。

批評者認為,Anthropic此舉不過是其一貫“監(jiān)管俘獲”策略的延伸——通過渲染AI風險來給監(jiān)管部門施壓,從而限制競爭對手,尤其是那些開源模型的發(fā)展空間。也有人將Anthropic對自家"Mythos"網絡安全模型的限制性發(fā)布解讀為一種營銷手段:一方面炫耀能力,一方面又以“安全”為由拒絕全面開放。支持者則認為,Anthropic對AI風險的警示有其真誠的一面。賓大沃頓商學院教授 Ethan Mollick表示,AI 實驗室往往不是單一主體:它既有萬億美元公司的營銷、律師和資本邏輯,也有追求下一代模型的研究人員,還有真心憂慮未來的“哲學王”式人物。

數(shù)據(jù)本身已足夠震撼:Anthropic年化營收從2025年底的90億美元,將于2026年6月底飆升至500億美元;公司已秘密提交IPO文件;其最新模型Mythos Preview可連續(xù)工作超過16小時,并在首批測試中發(fā)現(xiàn)了全球最重要系統(tǒng)中逾一萬個高危軟件漏洞。

在這場“加速”與“剎車”的悖論中,Anthropic的這篇博文或許是迄今為止AI行業(yè)最誠實也最矛盾的自白。

Anthropic呼吁全球暫停AI開發(fā)

1. 我們相信,讓世界擁有放緩或臨時暫停前沿AI開發(fā)的選項,將對世界有益——以使社會結構和對齊研究能跟上技術進步的步伐。

2. 訓練運行比導彈發(fā)射井更容易隱藏,其投入具有通用性,而且秘密違約的激勵極大,因為當其他人暫停時,繼續(xù)推進者可能繼承領先地位。

3. AI遞歸自我改進尚未發(fā)生,也并非不可避免。但它到來的時間,可能早于大多數(shù)機構所準備的。 那類技術從未存在過,但我(Jack Clark)相信這可能在未來兩年內發(fā)生,甚至更早。

4. 如果系統(tǒng)能夠完全構建自己的繼任者,那么我們保護、監(jiān)控并塑造其行為的方式就會變得重要得多。

5. 在缺乏協(xié)調一致的全球性放緩的情況下,我們面臨的是當前局面:強大的技術正以令人窒息的速度,被各國各類行為者開發(fā),彼此競爭,商業(yè)和地緣政治的角力正在淹沒這項技術對物種層面的存在性影響。

6. Claude撰寫的代碼在2025年底還略遜于人類,如今大致持平,我們預期一年內將嚴格優(yōu)于人類。

7. 大約一年前,我開始大量使用Claude工作流程。那是一段瘋狂的經歷,距離我最后一次親自寫代碼,現(xiàn)在已經大約五個月了?!狝nthropic員工

8. 簡言之,“執(zhí)行”本身——寫代碼、跑實驗、產出結果——如今幾乎不再消耗人類時間,盡管仍然消耗算力。

9. 順利的日子里,我不禁覺得我做的一切都無關緊要,一切都被自動化了,比我更快更好。但也有一切都崩了、我不明白為什么的日子,我意識到我已不再清楚自己究竟在做什么?!狝nthropic員工

10. Edison說天才是1%的靈感加99%的汗水。但我們看到汗水正在被日益自動化。

《當AI構建自身》(When AI Builds Itself)全文翻譯如下:

當AI自我構建

我們在遞歸自我改進方面的進展及其影響

在AI發(fā)展史的大部分時間里,人類主導著其發(fā)展周期的每一個步驟。但在Anthropic,我們正將越來越多的AI開發(fā)工作委托給AI系統(tǒng)本身,這正在加速我們的研發(fā)進程。

如果這一趨勢延續(xù)足夠長的時間,并獲得足夠的算力,其最終指向是:AI系統(tǒng)將能夠完全自主地設計和開發(fā)自己的繼任者。這被稱為遞歸自我改進。我們尚未達到這一階段,遞歸自我改進也并非不可避免。但它到來的時間,可能早于大多數(shù)機構所預期的。

Anthropic研究院利用公開基準測試數(shù)據(jù),以及Anthropic內部此前未曾公開的數(shù)據(jù),證明AI已經在加速AI系統(tǒng)的開發(fā)。僅舉一例:如今,Anthropic工程師每季度平均提交的代碼量,是2021年至2025年間的8倍。

本文探討的技術趨勢表明,AI系統(tǒng)的能力將在未來數(shù)年內大幅躍升。這些趨勢影響深遠。能夠自我構建的AI,將是技術史上的重大突破——它有望在科學、醫(yī)療等領域為世界帶來巨大福祉。但完整的遞歸自我改進,也可能加劇人類失去對AI系統(tǒng)控制權的風險。一旦系統(tǒng)能夠完全自主構建自身的繼任者,我們對其實施安全保障、監(jiān)控管理以及行為塑造的方式,都將變得遠比現(xiàn)在更加重要。

構建第一代Claude

早期,Anthropic的工作與其他科技公司并無二致:員工們在筆記本電腦上編寫代碼和文檔。

聊天機器人

人們開始借助早期聊天機器人輔助完成部分工作,例如生成簡短的代碼片段,再將輸出內容復制到文本編輯器中。

編程智能體

隨著智能體能力的增強,它們能夠獨立編寫和修改代碼,有時甚至可以處理整個文件。

自主智能體

智能體現(xiàn)在可以自行運行代碼,并將數(shù)小時的工作委派給其他智能體。

閉合循環(huán)

未來,智能體或將具備足夠的能力,自主構建和訓練模型。若果真如此,Claude的后續(xù)版本將能夠由Claude自身持續(xù)迭代改進。

罕見!“AI巨頭”Anthropic呼吁全球暫停AI開發(fā),警告模型正逐步具備“自我升級”能力

來自外部世界的證據(jù)

AI模型的進步速度正在加快。模型能夠獨立可靠完成任務的時長,此前大約每七個月翻一番,如今這一周期已縮短至約每四個月翻一番。2024年3月,Claude Opus 3能夠完成人類約需四分鐘完成的軟件任務;一年后,Claude Sonnet 3.7已能處理約需一個半小時的任務;再過一年,Claude Opus 4.6已能勝任需時12小時的任務。1 若此趨勢持續(xù),今年之內,需要熟練人員數(shù)天才能完成的任務或將進入AI的能力射程;到2027年,AI系統(tǒng)或許能夠勝任需要人類數(shù)周才能完成的工作。

同樣的規(guī)律也出現(xiàn)在編程和研究基準測試中。基準測試衡量模型在特定領域的表現(xiàn),當模型成績接近滿分時,該基準即被視為"飽和"。2 SWE-bench是一項標準的真實世界軟件工程測試:它向模型提供一個真實的開源代碼庫和一份真實的缺陷報告,要求模型編寫代碼修復問題,并通過項目自身的測試。模型的得分已從個位數(shù)的低分,在兩年內發(fā)展到使該基準趨于飽和。

CORE-Bench測試模型能否復現(xiàn)已有研究成果,這是模型開展原創(chuàng)研究的前提條件。它向AI模型提供一篇已發(fā)表論文的代碼和數(shù)據(jù),要求其重新運行所有內容并確認能否復現(xiàn)論文結果。AI系統(tǒng)的復現(xiàn)成功率從2024年的約20%,在十五個月后便使該基準趨于飽和。負責運營長時任務基準測試的METR發(fā)現(xiàn),Claude Mythos Preview能夠持續(xù)工作"至少"16小時,已"處于[METR]在不引入新任務的情況下所能評測范圍的上限"。

公開基準測試能夠揭示很多關于這些系統(tǒng)能力的信息,但無法反映AI系統(tǒng)對加速AI開發(fā)本身所產生的影響。要了解這一點,我們需要來自Anthropic等AI公司內部的直接證據(jù)。

來自Anthropic內部的證據(jù)

構建一個前沿模型,大致需要兩類工作:其一是工程工作,包括編寫代碼、搭建基礎設施和監(jiān)督模型訓練;其二是研究工作,包括決定運行哪些實驗、解讀實驗結果,以及確定下一步嘗試哪些方向。

在工程和研究兩個領域,情況如出一轍。在工程方面,Claude可以接手一個規(guī)格不明確的問題并自行找出解決方案;人類提供目標,但無需再提供方法。在研究方面,Claude在執(zhí)行規(guī)格明確的實驗時,已能媲美乃至超越熟練的人類研究員。然而,在需要Claude自主判斷和設定目標時,無論是工程還是研究領域,都仍存在顯著的能力差距。正是這一差距,將今天的AI與未來能夠自主設計繼任者的系統(tǒng)區(qū)分開來。

在Anthropic,員工隨著經驗積累,通常會承擔更具開放性和重要性的任務。最初,他們執(zhí)行別人指定好的任務,例如:"導出按鈕失效了,請修復它。"隨著經驗增長,他們會接到一個目標,然后自行設計解決方案,例如:"調查一下為何網絡在高負載下會變慢。"在最高級別,他們需要自行判斷哪些問題值得解決:"團隊下個季度應該做什么?"我們可以借助Anthropic的內部數(shù)據(jù),觀察Claude在處理這些不同類型任務方面已走了多遠。

Claude已撰寫了Anthropic相當大比例的代碼。 截至2026年5月,合并到Anthropic代碼庫中的代碼,超過80%由Claude創(chuàng)作。3 而在2025年2月Claude Code以研究預覽版發(fā)布之前,這一比例還處于個位數(shù)的低水平。這一轉變同樣體現(xiàn)在每位工程師的產出量上。每位工程師每天合并的代碼行數(shù),在Anthropic最初四年(2021—2024年)保持穩(wěn)定,隨后在2025年開始上升——彼時Claude已從僅給出建議供工程師復制粘貼,轉變?yōu)槟軌蛑苯舆\行代碼。2026年,隨著模型開始在更長時間跨度內自主工作,這一增長斜率再度加陡。這兩個拐點如下圖所示。2026年第二季度,典型工程師每天合并的代碼量是2024年的8倍。? 這是因為大量代碼由Claude編寫,工程師負責指導和審閱,而非自己親手輸入。

罕見!“AI巨頭”Anthropic呼吁全球暫停AI開發(fā),警告模型正逐步具備“自我升級”能力

柱狀圖:按人員、按季度統(tǒng)計的代碼貢獻量,時間跨度從2021年第二季度至2026年第二季度。圖中標注了八個不同模型的發(fā)布日期:Claude 1、Claude 2、Claude 3、Claude 4、Claude Code、Claude Sonnet 4.5、Claude Opus 4.5、Claude Mythos Preview(內部訪問)及Claude Mythos Preview。

關閉

游客海上漂流7天遇漁民死里逃生 奇跡生還背后的故事

游客海上漂流7天遇漁民死里逃生2026-06-05 10:29:13

普京:中國發(fā)展強勁 全球角色日益重要

普京,中國發(fā)展強勁2026-06-05 10:27:44

端午假期火車票今起開售了!端午多航線仍有300元左右機票

端午多航線仍有300元左右機票2026-06-05 10:27:00

印度人為躲高溫半夜睡大街 極端熱浪下的生存挑戰(zhàn)

印度人為躲高溫半夜睡大街2026-06-05 10:21:42

普京:中國發(fā)展強勁 全球角色日益重要

普京,中國發(fā)展強勁2026-06-05 10:27:44

美媒:中國汽車在美取得突破 吉利打開市場準入大門

美媒,中國汽車在美取得突破2026-06-05 09:21:07

普京:俄方愿在美國安克雷奇與烏談判 澤連斯基提議直接會晤

普京,俄方愿在美國安克雷奇與烏談判2026-06-05 09:03:35

60張鐵路大票顯示已裝車實際未裝車 玉米專列離奇消失

60張鐵路大票顯示已裝車實際未裝車2026-06-05 10:04:04

澤連斯基向普京發(fā)出公開信 提議直接會晤結束沖突

澤連斯基向普京發(fā)出公開信2026-06-05 09:26:49

有人還沒登上去天涯 重啟難回往日輝煌

有人還沒登上去天涯2026-06-05 10:10:51

全線跳水!超14萬人爆倉 比特幣減持引發(fā)市場動蕩

全線跳水,超14萬人爆倉2026-06-05 08:55:25

航母福建艦最新動態(tài)曝光 配置差異引發(fā)討論

航母福建艦最新動態(tài)曝光2026-06-05 09:04:09

中國多地省長密集下井 加強煤礦安全檢查

中國多地省長密集下井2026-06-05 10:10:17

退役軍人還在脫密期,就簽出國勞務合同 無視規(guī)定踩紅線

退役軍人還在脫密期,就簽出國勞務合同2026-06-05 10:05:04

五眼聯(lián)盟間諜竊密劣跡斑斑 全球無底線監(jiān)聽監(jiān)控

五眼聯(lián)盟間諜竊密劣跡斑斑2026-06-05 08:57:50

G7峰會將召開,馬克龍“攢局”:奧爾特曼確認要來,孫正義計劃在法投資 AI成焦點議題

G7峰會將召開,馬克龍攢局,奧爾特曼確認要來,孫正義計劃在法投資2026-06-05 09:14:25

限制特朗普對伊動武決議通過 國會限制總統(tǒng)軍事權

限制特朗普對伊動武決議通過2026-06-05 08:57:12

鐵路端午假期購票日歷 提前規(guī)劃錯峰出行

鐵路端午假期購票日歷2026-06-05 10:13:01

報告稱藍領收入增速連續(xù)6年超白領 收入差距顯著收窄

報告稱藍領收入增速連續(xù)6年超白領2026-06-05 10:15:30

潛逃境外十余年嫌疑人被抓回 偽造合同騙貸終落網

潛逃境外十余年嫌疑人被抓回2026-06-05 10:16:11

男子被姐夫訓斥起殺心 兒子奪刀制止

男子被姐夫訓斥起殺心兒子奪刀制止2026-06-05 10:18:33

游客海上漂流7天遇漁民死里逃生 奇跡生還背后的故事

游客海上漂流7天遇漁民死里逃生2026-06-05 10:29:13

比特幣較歷史高點已下跌50% 市場爆倉超16億美元

比特幣較歷史高點已下跌50%2026-06-05 10:12:26

馬斯克財富超過125國GDP 科技大亨邁向萬億富翁

馬斯克財富超過125國GDP2026-06-05 08:48:26

美股芯片股,全線下跌 半導體板塊遭重挫

美股芯片股,全線下跌2026-06-05 08:56:55

農戶近39畝確權耕地多年未獲惠農補貼 當?shù)劓?zhèn)政府回應

農戶近39畝確權耕地多年未獲惠農補貼2026-06-05 10:24:59

北約秘書長警告俄軍傷亡慘重 渲染戰(zhàn)場恐怖氛圍

北約秘書長警告俄軍傷亡慘重2026-06-05 08:50:16

沖繩恐成日本再軍事化棋子 強化戰(zhàn)時醫(yī)療體制

沖繩恐成日本再軍事化棋子2026-06-05 08:52:25

中國往返伊朗航線恢復運營 每周16班直飛

中國往返伊朗航線恢復運營2026-06-05 08:48:40

端午假期火車票今起開售了!端午多航線仍有300元左右機票

端午多航線仍有300元左右機票2026-06-05 10:27:00

美方關稅“一增一降” 商務部表態(tài) 中美經貿關系需穩(wěn)定

美方關稅一增一降商務部表態(tài)2026-06-05 08:50:33

美出口管制、澳牛肉觸及配額、中巴農產品貿易,商務部熱點回應 牛肉進口關稅調整引發(fā)關注

美出口管制,澳牛肉觸及配額,中巴農產品貿易,商務部熱點回應2026-06-05 08:48:15

美軍一飛行員在中東兩次被擊落 罕見經歷引發(fā)關注

美軍一飛行員在中東兩次被擊落2026-06-05 08:54:55

女子反抗性騷擾被殺 兇手欲給其辦網貸 案件即將開庭審理

女子反抗性騷擾被殺兇手欲給其辦網貸2026-06-05 10:05:27

三輪車撞護欄車身一半懸空20米 路過的他們沖上來死死拽住

三輪車撞護欄車身一半懸空20米2026-06-05 10:22:53

相關新聞