Anthropic的產(chǎn)品負(fù)責(zé)人Alex Albert在一次35分鐘的訪談中,首次詳細(xì)披露了Claude模型的研發(fā)全過程。Alex是打造下一代Claude模型的核心人物,在與科技博主Peter Yang的對話中,他幾乎毫無保留地分享了內(nèi)部造Claude的方法論,包括研發(fā)邏輯、內(nèi)部評估流程、性格訓(xùn)練方法以及正在推進(jìn)的意識研究。

Claude的每一代模型在預(yù)訓(xùn)練前就被明確規(guī)劃好其擅長的能力,如編程能力、知識工作能力和Excel表格處理能力等。這些決策基于企業(yè)客戶的反饋和Anthropic員工在日常工作中遇到的問題。Anthropic團(tuán)隊將模型視為一個產(chǎn)品來對待,確保每個新模型在訓(xùn)練前就明確定義其核心能力。

Alex還介紹了Anthropic內(nèi)部的一個核心決策框架——“單向門”(One-Way Door),即不可逆的決策。例如,在預(yù)訓(xùn)練之前選定模型架構(gòu)就是一個典型的單向門決策。但隨著技術(shù)的發(fā)展,許多過去被認(rèn)為是單向門的決策現(xiàn)在變得可逆。這使得開發(fā)時間大大縮短,以前構(gòu)建一個MVP需要2-4周,現(xiàn)在只需1天。Anthropic自己也是Claude最苛刻的用戶,通過使用Claude來訓(xùn)練Claude,形成了一個閉環(huán)。

為了評估Claude的表現(xiàn),Anthropic采用了用戶反饋、聚類分析、生成合成數(shù)據(jù)并轉(zhuǎn)化為評估基準(zhǔn)的方法。這些合成問題最終會成為測試下一代Claude能力的標(biāo)準(zhǔn)評估集。評估必須錨定在真實用戶的真實任務(wù)上,只有當(dāng)評估與實際場景對齊時,研究團(tuán)隊才會投入資源進(jìn)行修復(fù)。
人工智能公司Anthropic指控中國開發(fā)者竊取其Claude聊天機(jī)器人的商業(yè)機(jī)密
2026-02-25 09:04:09馬斯克抨擊Anthropic最近,一個名為「caveman」的Claude Code插件在Hacker News上引起了廣泛關(guān)注
2026-04-08 09:21:19Claude防話癆插件爆火