Transformer是當(dāng)前大型語言模型發(fā)展的核心基礎(chǔ),但也有不少頂尖研究者在探索其他路徑。這其中甚至包括Transformer的創(chuàng)造者之一、Sakana AI創(chuàng)始人兼CTO Llion Jones。他在一篇博客中表示,雖然他不認(rèn)為應(yīng)該完全拋棄Transformer,但他個人正在大幅減少對它們的研究時間,并明確地尋找下一個目標(biāo)。他呼吁大家加大探索力度,不要局限于同一個地方,去尋找新的高峰。
與此同時,The Information報道了前OpenAI研究副總裁Jerry Tworek創(chuàng)立的新公司Core Automation。Tworek在OpenAI期間負(fù)責(zé)強(qiáng)化學(xué)習(xí)領(lǐng)域的工作,并對推理模型、編程工具和AI智能體開發(fā)做出了重要貢獻(xiàn)。知情人士透露,Core Automation成立僅幾周,目前正尋求5億至10億美元的融資。
根據(jù)向潛在投資者展示的材料,Tworek計劃采用與OpenAI、Anthropic等大廠不同的路徑來開發(fā)AI模型。他希望打造具備“持續(xù)學(xué)習(xí)”能力的模型,即能夠從現(xiàn)實(shí)世界的實(shí)踐中即時獲取知識?,F(xiàn)有AI模型尚不具備這種能力。他的創(chuàng)業(yè)計劃仍處于早期階段,融資規(guī)模和產(chǎn)品路徑可能發(fā)生變化。
事實(shí)上,Core Automation并非孤例,而是代表了一個雖小但日益壯大的群體。這些研究人員認(rèn)為AI領(lǐng)域需要一場徹底變革。他們認(rèn)為,當(dāng)前主流的模型開發(fā)技術(shù)雖然流行,但在生物、醫(yī)學(xué)等領(lǐng)域難以取得重大突破,且無法根除AI經(jīng)常犯低級錯誤的問題。
據(jù)了解,Tworek本月初離開OpenAI,以探索那些在OpenAI內(nèi)部難以推進(jìn)的研究方向。在融資材料中,Core Automation表示仍將使用大型神經(jīng)網(wǎng)絡(luò),但會重新審視模型開發(fā)的每一個環(huán)節(jié),甚至包括訓(xùn)練神經(jīng)網(wǎng)絡(luò)的基本方法“梯度下降”。Tworek計劃開發(fā)一種對數(shù)據(jù)量和計算資源需求更低的模型,并通過構(gòu)建全新架構(gòu)取代現(xiàn)有的Transformer架構(gòu)。此外,他還希望將原本割裂的模型訓(xùn)練步驟整合為單一流程。
國民黨主席改選臨近,引發(fā)廣泛關(guān)注。25日晚,國民黨團(tuán)首席副書記長羅智強(qiáng)宣布參選黨主席
2025-08-26 09:29:15馬英九前幕僚將參選國民黨主席