您当前的位置 :金融 >
焦点滚动:DeepSeek:发布新论文提出mHC架构,助力基座模型演进
2026-01-01 19:08:48   来源:和讯网  分享 分享到搜狐微博 分享到网易微博


(资料图)

【1月1日DeepSeek发布新论文提出mHC架构,有望助力基座模型演进】1月1日,DeepSeek发布新论文,提出流形约束超连接新架构。该架构旨在解决超连接网络(HC)技术因破坏恒等映射特性,导致训练不稳定和可扩展性受限等问题。mHC架构将HC残差连接空间映射至特定流形恢复恒等映射特性,结合基础设施优化确保效率。实现了显著性能改进和优越可扩展性。DeepSeek预计,mHC作为HC的灵活实用拓展,将助力深入理解拓扑架构设计,为基座模型演进指明前景方向。论文由Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao共同担任第一作者,梁文锋也在作者名单中。



[责任编辑:ruirui]





关于我们| 客服中心| 广告服务| 建站服务| 联系我们
 

中国焦点信息网 版权所有 沪ICP备2022005074号-20,未经授权,请勿转载或建立镜像,违者依法必究。