连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

快科技8月19日消息,摩尔线程正式发布了夸娥智算集群KUAE 1.2版本,通过软硬件层面的综合性优化,在功能、性能上多维升级,更高效、稳定,对生态系统更友好,可为大模型训练提供更坚实可靠的算力支撑。

夸娥1.2主要升级点:

▼MFU提升10% 最高可达55%

在新版本中,使用千卡集群训练千亿模型,MFU(模型算力利用率)提升10%。

稠密模型集群训练中,MFU最高达到55%。

▼Flash Attention2优化

通过集成最新的MUSA SDK平台与优化后的Flash Attention2技术,结合新版Torch MUSA和算子融合,显著提升了大模型训练的效率与资源利用率,大幅缩短训练周期,并降低了整体成本。

▼64K长文本支持

增强了对长文本大模型训练的支持,优化了处理长文本理解和生成任务的能力,能够更好地应对文档摘要、文章写作等复杂语言处理任务。

▼支持混合专家模型MoE

MCCL通信库完成了All2All优化,并针对muDNN算子在不同形状下的矩阵运算进行了优化,以更好地支持MoE(Mixture of Experts)大模型的训练。

这不仅提升了智算效率,还为更大规模参数的大模型训练提供了高度可扩展的基础。

▼断点续训

进一步提升了大模型训练的Checkpoint(检查点)读写性能,写入时间小于2秒,显著提高训练效率。

▼优化DeepSpeed

支持DeepSpeed、Ulysses的适配和性能优化,强化了长文本训练支持。

适配国内外多款大模型,在Hugging Face上支持训练和微调主要的开源大模型,创新型企业可以灵活选择不同的大模型开发智能应用。

▼稳定性提升

千卡集群软硬件进一步成熟,实现了连续无故障训练长达15天。

新版本引入了KUAE Aegis可靠性功能,加强了对GPU、显存、集合通信等方面的监控、自动诊断与故障恢复能力。

▼可视化/可观测

引入了PerfSight性能监控系统,可实时显示模型训练过程中的资源消耗与性能分析数据,有助于快速发现并恢复训练期间的故障,满足大模型上的性能调优需求。

▼内置模型库中新增大模型

KUAE内置模型库Model Zoo新增LLaMA2全系列大模型、百川、雅意、Qwen2、Mixtral(MoE 8x7B)等模型。

连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2

以上就是关于【连续无故障训练15天!摩尔线程发布夸娥智算集群KUAE 1.2】的相关消息了,希望对大家有所帮助!

文章来源于网络。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/2024/08/19/14638.html

(0)
北方经济网的头像北方经济网
上一篇 2024 年 8 月 19 日 下午10:03
下一篇 2024 年 8 月 19 日 下午10:03

相关推荐

  • 比亚迪公布“夏”字LOGO全民共创作品 五款图标你更喜欢哪个?

    快科技9月14日消息,2024成都车展上,比亚迪王朝网发布第六大IP夏;同时,比亚迪全新MPV也在车展亮相,命名为夏。 比亚迪方面表示,夏字IP全民共创,邀请所有网友参与设计,被选中者可免费开三年比亚迪夏MPV。 比亚迪建议,王朝网现有的汉、唐、秦、宋、元等系列标识均融合了小篆书法元素,因此官方建议夏系列的标识设计也应包含小篆书法风格,以保持视觉一致性。 今…

    2024 年 9 月 14 日
    1000
  • 维基奇:决赛打郑钦文会很艰难 历史对决再现悬念

    8月2日,维基奇在东京奥运会网球项目上以6-4、6-0的比分强势战胜施密德洛娃,创造了历史,成为克罗地亚首位闯入奥运会网球单打决赛的运动员。尽管如今成就辉煌,维基奇却透露,她在不久以前险些选择退役。28岁的她因膝盖手术一度远离赛场,直至今年法国网球公开赛前夕,深感挫败,几乎放弃职业生涯。幸运的是,她没有放弃,不仅在温布尔登锦标赛打入女单四强,如今更是在奥运舞…

    2024 年 8 月 2 日
    3900
  • 日本央行释放重磅信号!仍有理由再次加息

    日本央行释放重磅信号。 8月20日,日本央行最新发布的两份研究报告警告称,日本经济中持续存在的通胀压力,表明该行仍有理由再次加息。值得注意的是,今年7月底,日本央行意外加息一度导致日股暴跌,日本股市遭遇黑色星期一,甚至引发全球金融市场巨震。 目前市场预计,日本央行将在9月的议息会议上暂停加息,但有机构表示,日本央行今年晚些时候或明年1月将再次加息。其中,全球…

    2024 年 8 月 21 日
    3300
  • 华为高阶智驾基础版加持 问界新M7 Pro版开售:24.98万起

    快科技8月6日消息,问界新M7全新版本开启小定,也就是搭载了华为ADS基础版智驾的Pro版,共四款配置车型,分别为五座后驱/四驱、六座后驱/四驱,价格为24.98-28.98万。 Pro版的到来,无疑会进一步强化问界M7的竞争力,毕竟Ultra版起售价28.98万的准入门槛确实高了些,如今不到25万就能买到,对于预算有限但喜欢M7的消费者无疑重大利好。 Pr…

    2024 年 8 月 6 日
    3500
  • 《赛博朋克2077》终于支持AMD FRS 3!还有帧生成

    快科技9月13日消息,历经漫长的等待,AMD、CD Project终于做到了,《赛博朋克2077》最新2.13版补丁终于加入了对AMD FSR 3超分技术的支持,同时还有帧生成! 不过需要注意的是,它支持的不是最新的FSR 3.1,还是FSR 3,帧生成也不是独立的选项,因此也不能和DLSS、XeSS共同使用。 FSR 3早在去年9月就发布了,至今已经整整一…

    2024 年 9 月 13 日
    1100

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

关注微信