欢迎访问 中国系统集成行业协会 官网!
当前位置:首页>>资讯中心

2025 数据中心:四大变革趋势引领行业新航向

发布时间:2025-04-15 09:58:32

   在当今数字化时代,数据中心行业正面临着前所未有的发展契机与挑战。一方面,业务规模的持续扩张、新兴技术的蓬勃兴起,促使数据中心需求呈现出爆发式增长;另一方面,可持续发展理念深入人心,如何在满足需求的同时,实现绿色、高效运营,成为行业发展的核心议题。在此背景下,摒弃传统孤立的发展视角,采用整体性、系统性的方法,成为推动数据中心多目标优化、实现可持续增长的关键所在。


   本文将深入探讨 2025 年有望颠覆数据中心行业格局的关键趋势,全面展现数据中心领域动态发展的前景。在解析主要趋势之前,先对能源及相关消耗情况进行一番总体审视。

2025年颠覆数据中心的四大趋势

能源:数据中心发展的核心驱动力

   能源,始终是推动人类社会进步的根基所在,未来数年,受经济持续增长以及需求上扬的双重驱动,能源产量预计仍将保持上升态势。回溯 2023 年,全球一次能源供应量约达 620EJ(即 17.2 万太瓦时),从能源结构来看,石油、煤炭与天然气占据主导地位,三者合计占比约 81%,可再生能源占比约 15%,核电占比约 4% 。


   电力,作为由一次能源转换而来的二次能源,在 2023 年,全球用电量攀升至近 108EJ(30,000 太瓦时)的历史新高,其供应高度依赖煤炭、可再生能源、天然气以及核能。在全球电气化浪潮的席卷下,预计 2024 年与 2025 年,电力需求将以每年 3% - 4% 的速率稳步增长。


   数据中心在诸多地区电力需求增长的进程中,扮演着极为重要的角色。2022 年,全球数据中心与加密货币领域的电力消耗约为 460 太瓦时,约占全球电力需求总量的 2% 。据预测,到 2026 年,这一数值将突破 1000 太瓦时。尽管从全球范围来看,数据中心整体用电量增长幅度相对平缓,但在部分数据中心市场规模不断扩张的国家,数据中心用电量正经历着迅猛增长。


   展望 2025 年,计算密集型工作负载的井喷式发展、应对更高功率需求的创新方案、液冷技术的广泛普及,以及在可持续性与效率提升方面的不懈努力,将成为颠覆数据中心传统发展模式的主要趋势。不过,需要明确的是,面对这些复杂多样的挑战,并不存在一种放之四海而皆准的通用解决方案。

计算密集型工作负载:重塑数据中心格局的强大力量

   数据中心工作负载深受近期高性能计算、人工智能以及生成式人工智能等计算密集型工作负载爆发式增长的影响。这些新兴工作负载不仅极大地刺激了新 IT 设备的生产制造,还通过增加 AI 就绪型或专用 AI 数据中心的数量,深刻改变着数据中心的整体格局。


   计算密集型工作负载的多样化与持续演变,给数据中心运营带来了全新挑战。为适配具备更高热设计功率(如 “超级芯片” 功率超 1kW)以及更高机架功率密度(每个机架功率可达 50+kW、100+kW 甚至 300+kW)的新型 IT 设备,数据中心必须积极采用更为高效的冷却及电源解决方案。


   以生成式人工智能工作负载为例,OpenAI 于 2019 年发布的 ChatGPT - 2 模型,其参数数量从 1.17 亿到 15 亿不等。2020 年推出的 GPT - 3 模型,参数数量激增至 1750 亿个,而 2023 年亮相的 GPT - 4 模型,预估参数数量约为 5000 亿个。模型参数数量直接反映了其学习与文本生成能力,通常而言,模型规模越大,其理解与生成复杂内容的能力就越强,这也意味着对训练与运行所需的计算资源提出了更高要求。值得注意的是,这些均属于前所未有的新型工作负载,相关应用才刚刚开始大量涌入市场。


   专用人工智能数据中心正逐步从概念走向现实,它通过优化计算、网络以及功率密度配置,旨在高效处理新型计算密集型工作负载,同时满足效率、可靠性、可扩展性、安全性以及可持续性等多方面目标。相较于传统数据中心,专用人工智能数据中心的功率密度大幅提升,并且随着工作负载与应用程序呈指数级增长,其设施规模也在不断扩大。预计到 2026 年,专用人工智能数据中心的电力消耗将达到 100 至 300 太瓦时。


   在人工智能芯片市场,英伟达目前占据着主导地位。然而,随着谷歌、微软、亚马逊、Meta 等大型企业,以及英特尔、AMD、博通、安培、Cerebras 等芯片设计公司纷纷推出自家解决方案,该领域的竞争格局正逐渐走向多元化,市场机遇也随之愈发成熟。

满足更高功率要求:创新方法不断涌现

   数据中心能源消耗与所处理的工作负载紧密相关。由于模型大小、复杂程度、基础设施差异以及所采用的优化技术各不相同,精确量化生成式人工智能(如 ChatGPT 查询)的能耗并非易事。经过海量文本数据训练的 ChatGPT,能够理解并生成类人文本。据估算,单次 ChatGPT 查询能耗在 1 至 10Wh 之间,取平均值约为 4.5Wh,这一数值大约是标准谷歌搜索能耗(约 0.3Wh)的 15 倍。值得欣慰的是,行业正积极探索各种途径,致力于提升人工智能系统的能源利用效率。


   在制定技术选型策略时,数据中心选址、电源可获取性以及电源需求等因素,成为至关重要的考量变量。数据中心运营者需要审慎抉择,是选择新建数据中心设施,还是对现有设施进行升级改造。部分现有数据中心可能会对部分区域进行针对性改造,以满足人工智能工作负载的需求。鉴于人工智能训练工作负载对延迟不敏感的特性,可将其部署在运营成本较低地区的设施中进行处理。而对于处理 AI 推理工作负载而言,低延迟、高可靠性与强扩展性则是关键要素,因此在选址时可能会倾向于成本相对较高但能满足这些要求的地区。


   不难发现,包括专用人工智能数据中心在内的新型数据中心开发项目,规模正不断扩大,已达到数百兆瓦级别,部分新项目的电力需求更是向千兆瓦量级迈进。如此庞大的电力需求,固然带来了严峻挑战,但同时也催生了诸多创新性解决方案,如微电网(分布式能源)、储能系统、具备电网交互能力的 UPS、涡轮机、发电机组、燃料电池、核能以及可再生能源等。


   在数据中心行业,施耐德电气、Vertiv、伊顿、ABB、华为等头部企业,已纷纷推出创新性解决方案,以应对数据中心持续增长的电力需求。此外,在特定技术细分领域,众多专注于此的专业公司也正引领行业发展潮流。


  这一领域面临的主要挑战包括:规避数据中心电力短缺风险、准确评估电网可靠性、增强电网弹性、探索离网解决方案的可行性、考量混合供电模式的实际应用效果、深入理解并严格遵守法规及可持续性要求等。

液体冷却:数据中心散热的新宠

   随着数据中心处理的计算密集型工作负载日益增多,由于 IT 设备热设计功率提升、功率密度增大,其对传热性能的要求愈发严苛。设备的热行为主要取决于所承载工作负载对应的功率需求,在此情形下,液体冷却技术脱颖而出,成为应对新型 IT 设备传热难题的主流解决方案,不仅显著提升了数据中心的运行效率,还降低了能耗。以下表格详细展示了数据中心采用液体冷却技术的主要驱动因素及面临的挑战。


   不同的液体冷却技术路线已通过实践测试,其中单相直接到芯片冷却技术优势显著,成为主流发展方向,推动了空气与液体冷却混合解决方案的广泛应用。与此同时,传统冷板、微流控微通道、微对流等多种技术也在不断发展成熟,但在可预见的未来,暂未出现占据绝对主导地位的技术方案。市场上还存在正负压系统、单相和两相冷却、浸泡式冷却、喷雾冷却、冷板与浸泡组合冷却等多种技术形式,甚至还有全新的技术理念不断涌现。预计在未来几年,大多数数据中心将至少部分采用某种形式的液体冷却技术。


   各国政府也在积极推动相关创新技术的发展。例如,美国能源部的 ARPA - E Coolerchips 计划,旨在 “将典型数据中心 IT 负载的总冷却能耗,在任何时间、任何地点均降低至 5% 以下”,这一举措有力地支持了颠覆性液体冷却解决方案的研发工作。


   液冷市场发展势头强劲,众多企业纷纷投身其中,各自推出独具创新性的解决方案。从 Vertiv、施耐德电气、Trane、Stulz、江森自控等数据中心冷却领域的头部供应商,到 Accelsius、Asperitas、Chilldyne、CoolIT Systems、GRC、Iceotope、Jetcool、LiquidStack、Mara、Quantas、Submer、Zutacore 等专注液冷细分领域的企业,均在为市场注入活力。此外,戴尔、惠普、技嘉、华为、IBM、浪潮、联想、Sugon、Supermicro、Wiwynn 等企业,也在直接面向最终用户,提供集成了液冷技术的 IT 设备解决方案。

可持续性与效率提升:数据中心发展的永恒追求

   数据中心行业的积极行动与坚定承诺,结合创新技术的应用以及政府政策的大力支持,对于推动数据中心效率提升与可持续发展至关重要。在全球脱碳进程不断加速的大背景下,人工智能正逐渐成为实现向低排放乃至净零排放未来转型的关键力量,有望助力强化可持续发展举措,减少温室气体(GHG)排放。然而,当前信息收集与利用的碎片化现状,在一定程度上阻碍了应对可持续发展与气候变化挑战的步伐。


   人工智能为解决这一难题提供了创新性思路,它不仅能够高效处理、聚合与分析海量数据集,还能以前所未有的效率优化复杂系统,提升预测精准度。以谷歌为例,其持续致力于推动计算基础设施的节能改造,并探索能够大幅降低人工智能模型训练能耗的方法。谷歌第六代张量处理单元(TPU)Trillium 相较于上一代 TPU v5e.1,节能效果提升超过 67%。在 2023 年,谷歌全年平均 PUE 值达到 1.10,并且自 2017 年起,其年度用电量已实现 100% 与可再生能源匹配。


   谷歌还充分利用人工智能模型,助力减少温室气体排放,涵盖基于交通、地形、车辆发动机等因素的节油路线规划模型;能够提前 7 天精准预测洪水的水文模型;以及通过优化交通信号灯时长,减少交通拥堵、降低燃料消耗的交通模型等。谷歌的目标是在 2030 年前,实现其整个运营及价值链的净零排放。


   尽管我们对人工智能在优化数据中心性能、提升效率方面的潜力充满信心,但也需清醒认识到其对环境产生的影响,以及在快速发展过程中各方协同合作的重要性。对人工智能资源消耗进行合理、负责任的管理,是确保行业可持续发展的关键。虽然目前我们对其当下资源需求已有较为清晰的认知,但未来发展路径仍存在诸多不确定性。


   倡导构建更加节能、可持续的数据中心,已成为行业发展的核心任务。可采取的策略包括:在数据中心设计与建设阶段,减少隐含碳排放量,降低运营过程中的温室气体排放;大力实施高效、可持续的电力与冷却解决方案,积极推进电气化进程;优化资源配置,提高利用效率;优先选用低排放能源;持续提升能源利用效率;强化水资源管理,实现合理用水;深度挖掘余热回收利用潜力;积极践行循环经济理念;将模块化设计与预制工程、预制基础设施相结合,广泛采用环保材料与技术等。


   可持续发展报告将逐渐成为行业最佳实践,其中将涵盖具体的可持续发展与效率指标。利益相关者对于可持续发展实践的透明度要求日益提高,期望通过减少温室气体排放、采用资源节约型方法,提升企业竞争力与行业整体形象。


   2024 年 3 月,欧盟委员会通过一项法规,旨在评估欧盟数据中心的可持续性表现。该法规的目标在于提高数据中心的透明度与运营效率,降低能源与水资源消耗,促进可再生能源的广泛应用,提升电网运行效率,推动废热回收再利用。对于装机 IT 电力需求在 500kW 及以上的数据中心运营商,要求其分别在 2024 年 9 月 15 日、2025 年 5 月 15 日之前提交报告,此后每年提交一次,报告内容涵盖数据中心的基本信息、关键绩效指标(能源与可持续性、ICT 容量与数据流量)以及可持续性指标(电力与水资源使用效率、能源再利用系数以及可再生能源系数)。


   声明:本站所使用的图片文字等素材均来源于互联网共享平台,并不代表本站观点及立场,如有侵权或异议请及时联系我们删除。