DeepSeek發(fā)布梁文鋒署名新論文 開源相關(guān)記憶模塊Engram
2026-01-13 09:12   
來源: 云財經(jīng)   
影響力評估指數(shù):17.05  
云財經(jīng)訊,DeepSeek于12日晚發(fā)布新論文《Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models》(基于可擴展查找的條件記憶:大型語言模型稀疏性的新維度)。該論文為北京大學與DeepSeek共同完成,合著作者署名中出現(xiàn)梁文鋒。論文提出條件記憶(conditional memory),通過引入可擴展的查找記憶結(jié)構(gòu),在等參數(shù)、等算力條件下顯著提升模型在知識調(diào)用、推理、代碼、數(shù)學等任務上的表現(xiàn)。同時,DeepSeek開源相關(guān)記憶模塊Engram。
| 新聞標題 | 時間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| ST納川:擬定第六屆獨立董事每年津貼12萬元 | 01-14 19:03 | 云財經(jīng) |
|
| 中材國際:2025年新簽合同額712.35億元,同比增12% | 01-14 16:40 | 云財經(jīng) |
|
| 甘肅向中度以上失能老年人發(fā)放養(yǎng)老服務消費補貼 | 01-14 14:14 | 云財經(jīng) |
|
| 機構(gòu):現(xiàn)貨黃金今年升破5000美元的概率已超30% | 01-13 12:35 | 云財經(jīng) |
|
| AI大潮下的電力企業(yè)轉(zhuǎn)型樣本:郴電國際 | 01-13 10:32 | 商業(yè)新聞 |
|
| 釩鈦股份:預計2025年年度凈利潤為負值 | 01-12 20:38 | 云財經(jīng) |
|