DeepSeek 联合清北重磅硬核论文:发力智能体底层基建,击穿 Agent 推理 I/O 瓶颈
金十数据 2 月 27 日讯,DeepSeekV4 发布前夕硬核重磅论文上线。DeepSeek 联合北大、清华研究团队提出了一种全新的大模型推理系统——DualPath。该系统通过引入“双路径 KV-Cache 加载”机制,巧妙利用了集群中闲置的网络带宽,将 Agentic 大模型负载的离线推理吞吐量提升了最高 1.87 倍,在线服务吞吐量平均提升了 1.96 倍。目前,这项研究已在包含多达 1152 张 GPU 的集群上完成了大规模验证,支持 DeepSeek-V3.2660B 等顶级大模型。