AI“探电”:Power shelf向Power rack升级

本周英伟达召开GTC大会其中Delta研发主管Ralf Pieper进行了题为《Grid-to-Chip Power Solutions for Giga-Wattscale AI Data Centers》[1]的演讲。

摘要

从Power shelf到Power rack,电源厂商重要性大幅升级。本次GTC大会麦格米特携带Power side car的方案进行参展,同时台达也在演讲中提出下一代Rubin方案将应用Power rack。Power rack集成了Power shelf、BBU shelf、Super cap shelf、PDU等产品,同时IT rack柜需800V到50V转化进一步增加了电源使用,因此我们认为电源厂商参与的价值量大幅增加。同时这也意味着AI电源行业竞争壁垒增厚,需具备多产品的技术能力。

800V高压应用使得熔断器等电路保护器件用量增加。从Delta展示来看,其在Power rack、HVDC power shelf、High voltage DCDC等多处都有应用。我们认为电源单独成柜导致需要高压方案降低电流以减少线损,而高压方案则进一步带动熔断器等器件用量增加以实现灭弧等电路保护措施。

SST是下一代数据中心的供电技术路线。 SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

超级电容显著降低供电的波动性。AI数据中心不断进行训练任务并进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当训练任务结束后又会下降至较低水平。超级电容利用快速充放电的特性实现降低供电波动性,根据台达电数据其超级电容能够将供电波动性从73%降至6%。

我们认为Power shelf到Power rack的技术架构变化中最受益的仍为服务器电源厂商,其一在于其价值量增加,其二在于其竞争壁垒增厚。从单纯的Power shelf到涵盖输入/输出PDU、BBU shelf、Super cap shelf等的Power rack这意味着价值量的大幅提升,此外由于单独成柜也要求Power rack和IT rack内各自有一套power shelf分别完成800Vdc和50Vdc的输出。

风险

AI资本开支不及预期,技术路线变动,行业竞争加剧

电源架构从Power shelf向Power rack升级

对于数据中心的输配电方案来讲,本次GTC大会最大的增量在于确立Power rack为下一代技术方案路线。对于GB200/GB300而言,主要采用NVL72/36的机架形式,其将power shelf、compute node、NVlink switch、CDU等都整合至同一个长方体式的机柜内部,但随着芯片本身的迭代升级其自身功率不断升级对于供电要求也越来越高。但我们看到整个机架中75%以上的体积被Compute node所占据,没有额外的空间为增量电源以及电源配件BBU、超级电容提供空间。因此将Powershelf、BBU shelf、Super cap shelf等移出机柜组建为一套Power rack形成新的供电单元以解决当前数据中心输配电所面临的问题。

图表1:当前电源架构面临的问题

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

Power rack方案带来输配电架构更高的集成度和全新的产品架构。Power rack将power shelf、BBU shelf、Super cap shelf、PDU等集成一体化,形成高度整合的电源旁柜方案。根据麦格米特在GTC大会中展出的Side car方案来看,其输入为384V~528V的交流电输出为800V的直流电,机柜尺寸为600mm(W)*1068mm(D)*2236mm(H)。具体而言,其上端集成了PDU方案,左侧为Powershelf右侧为BBU shelf和Super cap shelf等。

图表2:麦格米特Power rack的具体方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,麦格米特,中金公司研究部

► PDU:根据Delta的方案,PDU分为输入PDU和输出PDU。其中输入PDU内含L1-L3三路input busbar以及多个MCB短路保护器、熔断器等;而将BBU、power shelf、Super cap shelf等收集的800V电压回流至顶部的输出PDU后则需进一步完成Power rack到IT rack之间的连接。输出PDU内含继电器、熔断器等保护器件,其中相对昂贵的线缆可以大概承受68安培的电流,对应电压为800V则其每根线缆能够支撑54KW的功率。

图表3:Side car的PDU方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

► Powershelf:根据Delta的方案,Powershelf同样分为Power rack侧和IT rack侧的两类产品。1)Power rack侧的power shelf:其将PDU侧480Vac转化为800Vdc输出,其内部仍然是采用了经典的Vienna PFC+LLC拓扑结构,但由于电压较高内部损耗更低,整体效率可以达到98%+的水平。从具体的结构来看,台达的方案为一套Power rack侧的power shelf由两组27.5kw的PSU组成,综合功率共计55kw。2)IT rack侧的power shelf[2]:其将前端的800V直流电转化为50V的直流电供给至后端的DCDC模组。从具体结构来看,单层由6组15kw的PSU组成,合计约90kw,整体效率高达98.5%以上。

图表4:Power rack 侧的Powershelf拓扑结构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表5:Side car的Powershelf方案

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

英伟达预计2026-2027年将逐步开始应用Rubin,同步Power rack方案也将逐步落地。Rubin采用正交式的机架和Kyber方案,其具体结构为左右两个分立的机柜,左侧为IT-rack右侧为Power rack,根据英伟达估计2026-2027年将逐步应用Rubin,而2027-2028年逐步应用Feyman,而rubin方案的应用也代表着Power rack的方案将加速到来。

图表6:英伟达Kyber方案的架构(左)以及Rubin方案的时间线

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,中金公司研究部

电源架构持续升级,SST是面向未来的技术路线

谷歌曾在《+/-400Vdc Rack for AI/ML Applications》一文中给出了未来主流的数据中心供电架构演进的路线图,当前来看我们主要处于Architecture1、2,而Architecture3则代表着side car的方案,未来有望逐步进入SST方案下的输配电路线。

图表7:谷歌数据中心电源架构的Road map

AI“探电”:Power shelf向Power rack升级

资料来源:《+/-400Vdc Rack for AI/ML Applications》(Google,2024.10),中金公司研究部

从Architecture1、2到3、4最大的边际变化在于电压等级。从Architecture3开始,power shelf与服务器分离,彼此之间依靠线束进行连接。而对比来看,此前的Power shelf的输入为240V/380V 交流电,输出为50V直流电,而Power rack的存在意味着如果仍然以50V的电压等级进行输出则会在Power rack和IT rack之间的传输中电流较大,而线损往往是跟电流的平方成正比,因此需要大幅升高电压至800V以降低线损。

台达认为未来将进入800V SST的技术路线。SST方案能够直接将高至10~34.5KV的电流转化为800V的直流电输出,整体SST方案采用模块化设计,这也意味着电压在模块与模块之间均等分布。因此在不同的国家、地区,可以使用SST方案轻松地在不同的电压等级之间进行切换。

图表8:数据中心供电架构的逐步演进

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表9:SST架构

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

在IT rack侧的800V到50V电压转化也可以通过Tray level的形式进行降压。在Tray level上可以通过PDB(power distribute board)来实现板基级别的电压转化,直接将800V电压转化至50V或者12V的电压,由于电压跨度较高因此也对安全性、可靠性等提出了更高的要求,此外整体的功率密度也上升至500W/inch^3。

图表10:Tray level的800V到50V转化

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的应用有望

大幅提升GPU的动态负载能力

数据中心训练任务的动态负载特性主要表现为周期性、大幅度、瞬时性冲击等。AI数据中心的负载运行特点是不断进行训练任务进行高速运算,当开始训练任务时负载会迅速上升至较高功率,而当一次训练任务结束后又会下降至较低水平,而这样的波动性也对数据中心的供电构成了较大的挑战。

图表11:AI算力集群负载动态功耗曲线图

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

不同的超容方案特点有所差异。对比来看,EDLC方案的循环寿命较长可以达到1900万次,而LiC多为100万次左右,而EDLC的Hold up时长相对较短仅为1-2秒,而LiC约为10-15s,此外功率密度上LiC约为40-50Wh/Kg也高于EDLC的5-7Wh/Kg。

图表12:不同类型超级电容对比(左),台达的超级电容方案(右)

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

超级电容的具体工作过程分为四个阶段,其能够显著降低供电的波动性。具体来看,超级电容的工况依次经历50ms左右的EDPC+EDPP、20-30ms的EDPC、20-30ms的Idle以及最后的EPDC,以阶段1为例,在超过额定值的范围超级电容进行放电,在低于额定值的范围超级电容进行充电。从结果来看,超级电容能够将供电的波动性从73%压降至6%。

图表13:超级电容工作原理

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

图表14:超级电容效果对比

AI“探电”:Power shelf向Power rack升级

资料来源:Nvidia GTC,Delta,中金公司研究部

本文摘自中金公司2025年3月24日已经发布的《AI“探电”(六):GTC大会观察— Power shelf向Power rack升级》

江鹏 分析员 SAC 执证编号:S0080523080006

曲昊源 分析员 SAC 执证编号:S0080523060004 SFC CE Ref:BSW232

王颖东 分析员 SAC 执证编号:S0080522090002

主题测试文章,只做测试使用。发布者:北方经济网,转转请注明出处:https://www.hujinzicha.net/10594.html

(0)
北方经济网的头像北方经济网
上一篇 2025年3月26日 上午11:05
下一篇 2025年3月26日 上午11:05

相关推荐

  • 光伏能否底部反转?

    一、光伏行业在价格内卷下失血严重 国内光伏行业内卷加剧,产品价格迅速下滑。2023年起在全球碳中和、能源安全、地方政府产业竞赛等因素的驱动下,国内光伏产能快速扩张,各细分环节在全球市占率均在80%以上。但光伏装机需求并未能产能扩张的速度,叠加海外贸易政策扰动对光伏产品出口造成障碍,当前光伏行业面临较为严峻的产能过剩问题。截至2024Q3,以固定资产(含在建工…

    2025年3月25日
    800
  • 港股策略:底部已被抬升,中长期仍具备上涨潜力

    近期港股升势略放缓,似乎预示着在短暂“歇脚”准备新一轮上涨。恒指自1月以来累计上涨超15个百分点,成为全球主要股指表现最好的代表。经持续上涨,多项技术指标显示“超买”,也引发市场开始讨论行情的持续性以及后续上涨空间。虽从历史表现来看,技术指标与行情的方向不一定常有关联,但阶段性横盘除了能让技术信号恢复正常,也更符合市场的感受。然而,在短暂“歇脚”后,港股周五…

    2025年3月25日
    1200
  • 洪灏最新发声:目前的反弹是情绪变化的结果,我们正面临着一个强阻力位

    思睿集团首席经济学家洪灏,近日在彭博的访谈中,围绕DeepSeek,以及最近市场的反弹和其持续性,分享了最新观点。 洪灏表示,最近我们迎来了一波不错的反弹; 但是,值得注意的是,要从情绪性的反弹变成持续性的“长牛”,我们还有许多问题需要处理。 就过去10年而言,上市公司整体的每股收益几乎没有太大变化,股票的涨跌更多地来自于估值倍数的变化。 而本轮的反弹背后,…

    商业 2025年3月25日
    700
  • 积极财政:中央支出发力

    · 投资要点 ·一般公共预算收入:非税支撑仍在。2025年1-2月,全国一般公共预算收同比下降1.6%。其中,全国税收收入同比下降3.9%;非税收入同比增长11%。从主要分项看,增值税、消费税、企业所得税收入增速偏低。个人所得税收入虽然同比高增,主要与去年同期基数较低有关。 一般公共预算支出:中央高增,保障民生。2025年1-2月,全国一般公共预算支出同比增…

    2025年3月25日
    700
  • 中信证券:红利策略的长期配置价值依然存在

    从定量指标看,当前红利策略已呈现较为显著的底部特征:一是收益风险分布区间看,红利过去3个月业绩形成罕见的“负收益-高波动”特征,显著偏离其长期中枢分布、蕴含修复动能;二是相对市场超额,红利40日超额低于年均线已近-10%,历史规律看较大概率出现超额回归;三是红利ETF处于缩量净申购状态,通常对应策略底部阶段;四是量能指标看,红利风格量能已经低于警戒线水平,具…

    商业 2025年3月25日
    1100

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信