记者获悉,月之暗面 Kimi 发布技术报告,对大模型十年没有变化的核心结构残差连接行重新设计,使每一层能够选择性地关注此前各层输出,而非统一求和,48B 模型训练效率提升 1.25 倍,被行业解读为提前预告了下一代模型的关键模块。月之暗面三位联合创始人杨植麟、吴育昕、周昕宇带领数十名研究员完成了这项研究。
 
 
Back to Top