突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型

雷竞技app

  • 首页
  • 雷竞技app介绍
  • 产品展示
  • 新闻动态
  • 栏目分类
    你的位置:雷竞技app > 新闻动态 > 突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
    突破算力限制!Meta开源“记忆层”,重塑Transformer架构大模型
    发布日期:2025-01-26 04:59    点击次数:113

    扎克伯格旗下Meta Platforms分享了一个创新研究——Memory layers(记忆层)。目前,Transformer架构的预训练大模型在存储、查询数据时,随着参数的变大对算力的需求呈指数级增长。“记忆层”提出了新的高效查询机制替代了传统的查询方法,通过比较查询键与两个较小集合中的键,可以快速找到最相关的键,而无需遍历模型的整个记忆层。这也就是说,可以在不增加算力的情况下显著增加大模型的参数。



    上一篇:没有了
    下一篇:去屑止痒洗发水哪种好用「让秀发持久清爽无屑」