罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力

小大

用微信掃描二維碼
分享至好友和朋友圈

關鍵詞：

2026-06-05 10:29:24 新浪

罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力！一家估值接近萬億美元、正沖刺IPO的AI公司，突然公開呼吁全球暫停AI開發(fā)。

6月4日，Anthropic在官方博客發(fā)布了一篇題為《當AI構建自身》（When AI Builds Itself）的長文。文章由公司聯(lián)合創(chuàng)始人Jack Clark和內部研究機構負責人Marina Favaro聯(lián)合署名，首次罕見對外披露了一批此前從未公開的內部運營數(shù)據(jù)。

這些數(shù)據(jù)顯示，AI正在以驚人速度加速AI自身的開發(fā)進程：截至2026年5月，Anthropic超過80%合并入代碼庫的代碼由Claude撰寫；與2024年相比，工程師每日合并代碼量已增長8倍；在一項內部研究調查中，員工估計使用最新模型Mythos Preview后，自身產出約為不使用任何AI工具時的4倍。

更關鍵的是，Anthropic提出了一個令整個AI行業(yè)不安的概念警示：“遞歸自我改進”（recursive self-improvement）——即AI系統(tǒng)無需人類干預、自主設計并改進其繼任者的能力。這一階段尚未到來，但“可能在未來兩年內發(fā)生，甚至更早”。

根據(jù)這些數(shù)據(jù)，Anthropic提出一個在AI行業(yè)頗為罕見的主張：全球應協(xié)調考慮暫停或放緩前沿AI的開發(fā)。在業(yè)務高速擴張之際，Anthropic卻主動呼吁“踩剎車”——這一反常舉動，正在華爾街和硅谷同時引發(fā)爭議。

批評者認為，Anthropic此舉不過是其一貫“監(jiān)管俘獲”策略的延伸——通過渲染AI風險來給監(jiān)管部門施壓，從而限制競爭對手，尤其是那些開源模型的發(fā)展空間。也有人將Anthropic對自家"Mythos"網絡安全模型的限制性發(fā)布解讀為一種營銷手段：一方面炫耀能力，一方面又以“安全”為由拒絕全面開放。支持者則認為，Anthropic對AI風險的警示有其真誠的一面。賓大沃頓商學院教授 Ethan Mollick表示，AI 實驗室往往不是單一主體：它既有萬億美元公司的營銷、律師和資本邏輯，也有追求下一代模型的研究人員，還有真心憂慮未來的“哲學王”式人物。

數(shù)據(jù)本身已足夠震撼：Anthropic年化營收從2025年底的90億美元，將于2026年6月底飆升至500億美元；公司已秘密提交IPO文件；其最新模型Mythos Preview可連續(xù)工作超過16小時，并在首批測試中發(fā)現(xiàn)了全球最重要系統(tǒng)中逾一萬個高危軟件漏洞。

在這場“加速”與“剎車”的悖論中，Anthropic的這篇博文或許是迄今為止AI行業(yè)最誠實也最矛盾的自白。

Anthropic呼吁全球暫停AI開發(fā)

1. 我們相信，讓世界擁有放緩或臨時暫停前沿AI開發(fā)的選項，將對世界有益——以使社會結構和對齊研究能跟上技術進步的步伐。

2. 訓練運行比導彈發(fā)射井更容易隱藏，其投入具有通用性，而且秘密違約的激勵極大，因為當其他人暫停時，繼續(xù)推進者可能繼承領先地位。

3. AI遞歸自我改進尚未發(fā)生，也并非不可避免。但它到來的時間，可能早于大多數(shù)機構所準備的。那類技術從未存在過，但我（Jack Clark）相信這可能在未來兩年內發(fā)生，甚至更早。

4. 如果系統(tǒng)能夠完全構建自己的繼任者，那么我們保護、監(jiān)控并塑造其行為的方式就會變得重要得多。

5. 在缺乏協(xié)調一致的全球性放緩的情況下，我們面臨的是當前局面：強大的技術正以令人窒息的速度，被各國各類行為者開發(fā)，彼此競爭，商業(yè)和地緣政治的角力正在淹沒這項技術對物種層面的存在性影響。

6. Claude撰寫的代碼在2025年底還略遜于人類，如今大致持平，我們預期一年內將嚴格優(yōu)于人類。

7. 大約一年前，我開始大量使用Claude工作流程。那是一段瘋狂的經歷，距離我最后一次親自寫代碼，現(xiàn)在已經大約五個月了?！狝nthropic員工

8. 簡言之，“執(zhí)行”本身——寫代碼、跑實驗、產出結果——如今幾乎不再消耗人類時間，盡管仍然消耗算力。

9. 順利的日子里，我不禁覺得我做的一切都無關緊要，一切都被自動化了，比我更快更好。但也有一切都崩了、我不明白為什么的日子，我意識到我已不再清楚自己究竟在做什么?！狝nthropic員工

10. Edison說天才是1%的靈感加99%的汗水。但我們看到汗水正在被日益自動化。

《當AI構建自身》（When AI Builds Itself）全文翻譯如下：

當AI自我構建

我們在遞歸自我改進方面的進展及其影響

在AI發(fā)展史的大部分時間里，人類主導著其發(fā)展周期的每一個步驟。但在Anthropic，我們正將越來越多的AI開發(fā)工作委托給AI系統(tǒng)本身，這正在加速我們的研發(fā)進程。

如果這一趨勢延續(xù)足夠長的時間，并獲得足夠的算力，其最終指向是：AI系統(tǒng)將能夠完全自主地設計和開發(fā)自己的繼任者。這被稱為遞歸自我改進。我們尚未達到這一階段，遞歸自我改進也并非不可避免。但它到來的時間，可能早于大多數(shù)機構所預期的。

Anthropic研究院利用公開基準測試數(shù)據(jù)，以及Anthropic內部此前未曾公開的數(shù)據(jù)，證明AI已經在加速AI系統(tǒng)的開發(fā)。僅舉一例：如今，Anthropic工程師每季度平均提交的代碼量，是2021年至2025年間的8倍。

本文探討的技術趨勢表明，AI系統(tǒng)的能力將在未來數(shù)年內大幅躍升。這些趨勢影響深遠。能夠自我構建的AI，將是技術史上的重大突破——它有望在科學、醫(yī)療等領域為世界帶來巨大福祉。但完整的遞歸自我改進，也可能加劇人類失去對AI系統(tǒng)控制權的風險。一旦系統(tǒng)能夠完全自主構建自身的繼任者，我們對其實施安全保障、監(jiān)控管理以及行為塑造的方式，都將變得遠比現(xiàn)在更加重要。

構建第一代Claude

早期，Anthropic的工作與其他科技公司并無二致：員工們在筆記本電腦上編寫代碼和文檔。

聊天機器人

人們開始借助早期聊天機器人輔助完成部分工作，例如生成簡短的代碼片段，再將輸出內容復制到文本編輯器中。

編程智能體

隨著智能體能力的增強，它們能夠獨立編寫和修改代碼，有時甚至可以處理整個文件。

自主智能體

智能體現(xiàn)在可以自行運行代碼，并將數(shù)小時的工作委派給其他智能體。

閉合循環(huán)

未來，智能體或將具備足夠的能力，自主構建和訓練模型。若果真如此，Claude的后續(xù)版本將能夠由Claude自身持續(xù)迭代改進。

罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力

來自外部世界的證據(jù)

AI模型的進步速度正在加快。模型能夠獨立可靠完成任務的時長，此前大約每七個月翻一番，如今這一周期已縮短至約每四個月翻一番。2024年3月，Claude Opus 3能夠完成人類約需四分鐘完成的軟件任務；一年后，Claude Sonnet 3.7已能處理約需一個半小時的任務；再過一年，Claude Opus 4.6已能勝任需時12小時的任務。1 若此趨勢持續(xù)，今年之內，需要熟練人員數(shù)天才能完成的任務或將進入AI的能力射程；到2027年，AI系統(tǒng)或許能夠勝任需要人類數(shù)周才能完成的工作。

同樣的規(guī)律也出現(xiàn)在編程和研究基準測試中。基準測試衡量模型在特定領域的表現(xiàn)，當模型成績接近滿分時，該基準即被視為"飽和"。2 SWE-bench是一項標準的真實世界軟件工程測試：它向模型提供一個真實的開源代碼庫和一份真實的缺陷報告，要求模型編寫代碼修復問題，并通過項目自身的測試。模型的得分已從個位數(shù)的低分，在兩年內發(fā)展到使該基準趨于飽和。

CORE-Bench測試模型能否復現(xiàn)已有研究成果，這是模型開展原創(chuàng)研究的前提條件。它向AI模型提供一篇已發(fā)表論文的代碼和數(shù)據(jù)，要求其重新運行所有內容并確認能否復現(xiàn)論文結果。AI系統(tǒng)的復現(xiàn)成功率從2024年的約20%，在十五個月后便使該基準趨于飽和。負責運營長時任務基準測試的METR發(fā)現(xiàn)，Claude Mythos Preview能夠持續(xù)工作"至少"16小時，已"處于[METR]在不引入新任務的情況下所能評測范圍的上限"。

公開基準測試能夠揭示很多關于這些系統(tǒng)能力的信息，但無法反映AI系統(tǒng)對加速AI開發(fā)本身所產生的影響。要了解這一點，我們需要來自Anthropic等AI公司內部的直接證據(jù)。

來自Anthropic內部的證據(jù)

構建一個前沿模型，大致需要兩類工作：其一是工程工作，包括編寫代碼、搭建基礎設施和監(jiān)督模型訓練；其二是研究工作，包括決定運行哪些實驗、解讀實驗結果，以及確定下一步嘗試哪些方向。

在工程和研究兩個領域，情況如出一轍。在工程方面，Claude可以接手一個規(guī)格不明確的問題并自行找出解決方案；人類提供目標，但無需再提供方法。在研究方面，Claude在執(zhí)行規(guī)格明確的實驗時，已能媲美乃至超越熟練的人類研究員。然而，在需要Claude自主判斷和設定目標時，無論是工程還是研究領域，都仍存在顯著的能力差距。正是這一差距，將今天的AI與未來能夠自主設計繼任者的系統(tǒng)區(qū)分開來。

在Anthropic，員工隨著經驗積累，通常會承擔更具開放性和重要性的任務。最初，他們執(zhí)行別人指定好的任務，例如："導出按鈕失效了，請修復它。"隨著經驗增長，他們會接到一個目標，然后自行設計解決方案，例如："調查一下為何網絡在高負載下會變慢。"在最高級別，他們需要自行判斷哪些問題值得解決："團隊下個季度應該做什么？"我們可以借助Anthropic的內部數(shù)據(jù)，觀察Claude在處理這些不同類型任務方面已走了多遠。

Claude已撰寫了Anthropic相當大比例的代碼。截至2026年5月，合并到Anthropic代碼庫中的代碼，超過80%由Claude創(chuàng)作。3 而在2025年2月Claude Code以研究預覽版發(fā)布之前，這一比例還處于個位數(shù)的低水平。這一轉變同樣體現(xiàn)在每位工程師的產出量上。每位工程師每天合并的代碼行數(shù)，在Anthropic最初四年（2021—2024年）保持穩(wěn)定，隨后在2025年開始上升——彼時Claude已從僅給出建議供工程師復制粘貼，轉變?yōu)槟軌蛑苯舆\行代碼。2026年，隨著模型開始在更長時間跨度內自主工作，這一增長斜率再度加陡。這兩個拐點如下圖所示。2026年第二季度，典型工程師每天合并的代碼量是2024年的8倍。? 這是因為大量代碼由Claude編寫，工程師負責指導和審閱，而非自己親手輸入。

罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力

柱狀圖：按人員、按季度統(tǒng)計的代碼貢獻量，時間跨度從2021年第二季度至2026年第二季度。圖中標注了八個不同模型的發(fā)布日期：Claude 1、Claude 2、Claude 3、Claude 4、Claude Code、Claude Sonnet 4.5、Claude Opus 4.5、Claude Mythos Preview（內部訪問）及Claude Mythos Preview。

12 全文共 2 頁下一頁

關閉

罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力

相關新聞

今日熱點

頻道熱點

罕見！“AI巨頭”Anthropic呼吁全球暫停AI開發(fā)，警告模型正逐步具備“自我升級”能力