Opus 4.8更“誠實”:不強行給出答案 提升不確定性表達(dá)。隨著IPO預(yù)期升溫,Anthropic的產(chǎn)品模型更新節(jié)奏也在加快。最近,Anthropic發(fā)布了兩條重要消息:旗艦?zāi)P蜕墳镃laude Opus 4.8,并完成了650億美元的H輪融資,投后估值達(dá)到9650億美元,逼近萬億美元。

對于一家估值接近萬億美元的AI公司來說,市場關(guān)注的不僅是模型性能,還包括其能否將智能、工具、開發(fā)環(huán)境、云平臺和算力資源轉(zhuǎn)化為可規(guī)?;桓兜幕A(chǔ)設(shè)施。這意味著Anthropic需要從單純的模型提供商轉(zhuǎn)變?yōu)橹厮芷髽I(yè)AI工作方式的公司。

此次發(fā)布的Claude Opus 4.8是Anthropic對Opus系列的一次升級。新模型在編碼、智能體任務(wù)、推理和知識工作等方面均有提升,并且已經(jīng)面向用戶開放,使用價格保持不變,每百萬輸入token 5美元,每百萬輸出token 25美元。開發(fā)者也可以通過Claude API使用claude-opus-4-8。

從官方披露的信息來看,Opus 4.8的改進(jìn)覆蓋了編碼、智能體能力、推理能力和實際知識工作任務(wù)。早期測試者認(rèn)為Opus 4.8在執(zhí)行智能體任務(wù)時更可靠,判斷也更清晰。新模型在誠實性上也有顯著提升,更愿意說明工作中的不確定性,減少缺乏支撐的判斷。內(nèi)部評估顯示,Opus 4.8讓代碼缺陷未經(jīng)說明地通過的概率約為前代的四分之一。

在對齊和安全方面,Opus 4.8的表現(xiàn)明顯優(yōu)于Opus 4.7,并接近目前對齊表現(xiàn)最好的模型之一Claude Mythos Preview。安全、可靠、可控仍然是Anthropic的核心優(yōu)勢。不過,有網(wǎng)友發(fā)現(xiàn)Opus 4.8在某些情況下會把自己認(rèn)成其他模型,這可能與系統(tǒng)提示詞和產(chǎn)品層約束有關(guān)。

伴隨Claude Opus 4.8一同上線的還有多項產(chǎn)品和開發(fā)者功能。其中,effort control(思考強度調(diào)節(jié))讓用戶可以決定Claude在一次任務(wù)中投入多少推理算力。較高強度下,Claude會進(jìn)行更多推理以提高回答質(zhì)量;較低強度下,響應(yīng)更快,使用額度消耗也更慢。Opus 4.8默認(rèn)采用high effort,用戶還可以選擇extra或max。

dynamic workflows功能目前處于研究預(yù)覽階段,目標(biāo)是讓Claude Code處理大規(guī)模任務(wù)。該功能可以讓Claude動態(tài)編寫orchestration scripts,并在單個會話中運行數(shù)十到數(shù)百個并行subagents。典型應(yīng)用場景包括全服務(wù)范圍內(nèi)查找bug、性能優(yōu)化審計、安全審計、大型代碼庫遷移等。使用方式上,用戶可以直接要求Claude創(chuàng)建workflow,也可以在Claude Code中打開ultracode。

Anthropic還展示了Bun遷移案例,Jarred Sumner使用dynamic workflows將Bun從Zig移植到Rust,生成約75萬行Rust代碼,現(xiàn)有測試套件通過率達(dá)到99.8%,整個過程耗時約11天。此外,Messages API現(xiàn)在可以在messages array內(nèi)接受system entries,允許開發(fā)者在任務(wù)執(zhí)行過程中更新Claude的指令,同時不破壞prompt cache。

Anthropic還計劃在未來數(shù)周內(nèi)推出比Opus更智能的新模型類別Claude Mythos Preview。與此同時,Anthropic完成了650億美元的H輪融資,投后估值達(dá)到9650億美元。本輪由Altimeter Capital、Dragoneer、Greenoaks和Sequoia Capital領(lǐng)投,還包括亞馬遜等超大規(guī)模云廠商的150億美元既有承諾投資。這些資金將用于擴(kuò)大計算能力,支持Claude的需求增長。

Anthropic與亞馬遜簽署了最高5吉瓦新增容量協(xié)議,與Google和Broadcom簽署了5吉瓦下一代TPU容量協(xié)議,與SpaceX達(dá)成協(xié)議,可使用Colossus 1和Colossus 2中的GPU容量。Claude是首個同時進(jìn)入AWS、Google Cloud和Microsoft Azure三大云平臺的前沿模型,但AWS仍是主要云服務(wù)商和訓(xùn)練合作伙伴。

融資的背后反映了Anthropic商業(yè)定位的變化。早期大模型公司比拼的是模型能力和通用聊天體驗,而現(xiàn)在企業(yè)客戶更關(guān)心的是AI能否進(jìn)入核心流程,處理復(fù)雜任務(wù),接入開發(fā)環(huán)境、云平臺和內(nèi)部系統(tǒng)。Claude Code、Cowork、effort control、dynamic workflows和Messages API更新都在圍繞這個方向展開。

Anthropic正在同時擴(kuò)張三類能力:模型能力、工作流能力和基礎(chǔ)設(shè)施能力。Opus 4.8提高了編碼、推理、智能體任務(wù)和知識工作表現(xiàn),dynamic workflows讓Claude Code從單次代碼輔助走向更復(fù)雜的工程執(zhí)行和審查,而650億美元融資和算力擴(kuò)張則為后續(xù)模型訓(xùn)練和推理需求提供資源。Claude不再只是一個AI聊天窗口,而是成為連接模型、代碼、企業(yè)流程、云平臺和算力基礎(chǔ)設(shè)施的工作系統(tǒng)。


香港金管局今日就“香港地區(qū)部分銀行開立投資賬戶需簽署聲明”一事作出回應(yīng)。相關(guān)監(jiān)管要求已于5月22日向所有認(rèn)可機構(gòu)發(fā)出
2026-05-29 09:56:44香港加碼內(nèi)地投資者投資賬戶監(jiān)管5月28日下午,上汽集團(tuán)在上海北外灘世界會客廳舉行了“全球第一億位用戶交車儀式”
2026-05-29 09:53:03中國首個"億級車企"誕生