豆包大模型提出稀疏模型架构,推理成本较MoE最高可降83%

每日经济新闻| 2025-02-12 15:04:04

  每经北京2月11日电(记者杨昕怡)豆包大模型团队今日宣布,团队提出了全新的稀疏模型架构UltraMem,该架构有效解决了MoE(混合专家模型)推理时高额的访存问题,推理速度较MoE架构提升2~6倍,推理成本最高可降低83%。该研究还揭示了新架构的Scaling Law(规模定律),证明其不仅具备优异的Scaling特性,更在性能上超越了MoE。

该文观点仅代表作者本人,系信息发布平台,仅提供信息存储空间服务。

手机版 | 电脑版

© CopyRight 2022 tthmx.com All Right Reserved.

未经授权,请勿转载或建立镜像,违者依法必究

浙ICP备09070488号-8