DeepSeek-V4-Flash 上线华为云
金十数据 4 月 24 日讯,4 月 24 日,DeepSeek-V4 模型正式发布并开源,华为云首发适配。针对 DeepSeek-V4,华为云首发适配模型分层注意力压缩机制,实现 V4 注意力机制下 KVCache 的高效分配管理,提供 TopK、SWA、CFA 等 10+昇腾高性能融合算子,搭配框架异步调度、MTP 多步投机等框架优化,支持原生 1M 长上下文的高性能推理。当前,华为云 MaaS 模型即服务平台已为开发者提供免部署、一键调用 DeepSeek-V4-Flash API 的 Tokens 服务。
 
 
Back to Top