AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

快科技10月1日消息,AMD发布了自己的首个小语言模型(SLM),名为AMD-135M。

相比于越来越庞大的大语言模型(LLM),它体积小巧,更加灵活,更有针对性,非常适合私密性、专业性很强的企业部署。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135小模型隶属于Llama家族,有两个版本:

一是基础型AMD-Llama-135M,拥有多达6700亿个token,在八块Instinct MIM250 64GB加速器上训练了六天。

二是延伸型AMD-Llama-135M-code,额外增加了专门针对编程的200亿个token,同样硬件训练了四天。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
创建与部署流程

它使用了一种名为推测解码(speculative decoding)的方法,通过较小的草稿模型,在单次前向传播中生成多个候选token,然后发送给更大的、更精确的目标模型,进行验证或纠正。

这种方法可以同时生成多个token,不会影响性能,还可以降低内存占用,但因为数据交易更多,功耗也会增加。

AMD还使用AMD-Llama-135M-code作为CodeLlama-7b的草案模型,测试了推测解码使用与否的性能。

比如在MI250加速器上,性能可提升最多约2.8倍,锐龙AI CPU上可提升最多约3.88倍,锐龙AI NPU上可提升最多约2.98倍。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍
推测解码

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

AMD-135M小模型的训练代码、数据集等资源都已经开源,遵循Apache 2.0。

按照AMD的说法,它的性能与其他开源小模型基本相当或略有领先,比如Hellaswag、SciQ、ARC-Easy等任务超过Llama-68M、LLama-160M,Hellaswag、WinoGrande、SciQ、MMLU、ARC-Easy等任务则基本类似GTP2-124MN、OPT-125M。

AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍

以上就是关于【AMD发布首个AI小语言模型:6900亿token、推测解码提速3.88倍】的相关消息了,希望对大家有所帮助!

文章来源于网络。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/2024/10/01/25401.html

(0)
北方经济网的头像北方经济网
上一篇 2024 年 10 月 1 日 下午4:05
下一篇 2024 年 10 月 1 日 下午4:49

相关推荐

  • AI智能体“情智双优”,专治人类emo?

    ‍‍ 作者|雨谷 声明|题图来源于网络。惊蛰研究所原创文章,如需转载请留言申请开白。 2024年作为大模型落地元年,人们对于AI的探索已经从算法的精进,进一步深入到应用场景的拓展层面。一个最具代表性的现象是,几乎所有大模型公司和生态企业都将注意力投向了智能体。 惊蛰研究所注意到,刚刚在2024年百度云智大会落幕的第二届百度“文心杯”创业大赛上,参赛项目数量已…

    2024 年 9 月 27 日
    3400
  • 中国两大科技巨头联手!比亚迪宣布与华为智驾合作 未来自主研发和开放合作双线进行

    快科技8月27日消息,比亚迪方程豹与华为乾崑智驾在深圳签署合作协议,中国两大科技巨头强强联合,共同合作开发全球首个硬派专属智能驾驶方案,实现整车智驾深度融合,首发搭载在即将上市的方程豹豹8车型。 据了解,在智驾领域,比亚迪将以独立自主研发与开放合作双线进行。 在标准化智驾平台上,比亚迪全栈自研的高阶智驾天神之眼上车,并在腾势、王朝、海洋等多款车型实现搭载。 …

    2024 年 8 月 27 日
    4300
  • 赵明回应荣耀手机是否继续采用麒麟芯片:短期可能性不大

    快科技10月16日消息,日前,荣耀CEO赵明与360创始人周鸿祎进行直播,聊到AI、大模型、创业和企业家IP等话题。 针对直播时网友提出的荣耀手机是否会继续用麒麟芯片的问题,赵明也作出了回应。 赵明首先表示,这一代的荣耀Magic7会搭载骁龙8 Gen4,我们会支持最新的骁龙芯片。 用麒麟芯片短期内的可能性还不是很大,我知道大家也希望有这样的机会。赵明说。 …

    2024 年 10 月 16 日
    500
  • 蔚来、小米等知名车企的供应商今日申购

    本周(8月26日—8月30日),A股市场仅有1只新股申购,为创业板的富特科技,该股今日开启申购,资料显示,富特科技是行业知名的新能源汽车高压电源核心零部件供应商。 具体来看,富特科技发行价为14元/股,单一账户申购上限为6500股,顶格申购需持深市市值6.5万元。 招股书显示,富特科技是一家主要从事新能源汽车高压电源系统研发、生产和销售业务的国家…

    2024 年 8 月 26 日
    4500
  • 启动市值管理“超级工具箱”,年内至今近1800家公司实施回购,这十家公司金额超10亿元

    文丨余前广 编辑丨谢长艳 据Wind数据,2024年初至7月24日,有1783家上市公司实施了回购股份行为,其中:有273家回购金额在1亿元以上,有10家回购金额在10亿元以上(药明康德、三安光电、宁德时代、顺丰控股、宝钢股份、九安医疗、韦尔股份、和邦生物、通威股份、凯莱英),有213家明确回购目的为市值管理。 回购增持是上市公司释放被低估信号、稳定股价、护…

    2024 年 7 月 28 日
    7100

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信