DeepSeek于12日晚發(fā)布了一篇新論文《基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度》。這篇論文由北京大學與DeepSeek合作完成,梁文鋒是合著者之一。論文介紹了一種名為條件記憶的技術(shù),通過引入一種可擴展的查找記憶結(jié)構(gòu),在保持相同參數(shù)和計算資源的情況下,能夠顯著提高模型在知識調(diào)用、推理、代碼編寫和數(shù)學問題解決等任務(wù)上的表現(xiàn)。此外,DeepSeek還開源了相關(guān)記憶模塊Engram。
DeepSeek于12日晚發(fā)布了一篇新論文《基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度》。這篇論文由北京大學與DeepSeek合作完成,梁文鋒是合著作者之一
2026-01-13 10:06:00DeepSeek發(fā)布梁文鋒署名論文DeepSeek于12日晚發(fā)布了一篇新論文《基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度》。該論文由北京大學與DeepSeek共同完成,合著作者中包括梁文鋒
2026-01-14 00:09:42DeepSeek發(fā)布新論文