瑞士百达集团
AI军备竞赛再升级,芯片之后,数据中心接棒
人工智能应用的兴起推动了对算力和存储容量的需求。对企业、个人和政府而言,安全地处理和存储数据至关重要。因此,对先进数据中心的需求将不断增长,提供了在数据中心及其所依赖的基础设施方面的诱人投资机会。
数据中心提供处理人工智能大量工作负载所需要的基础设施,因此在满足这些不断升级的需求方面发挥着日益重要的作用。在过去十年中,开发者扩大了主机托管数据中心和超大规模数据中心的容量;后者专为满足大型科技公司和云服务提供商的高性能需求而设。
随着生成式人工智能的发展,对更大容量的需求将进一步推动未来几年大型公司的资本支出周期,并要求他们大力投资于数据中心基础设施。为了安全可靠地存储信息,数据中心基础设施需要不断升级以应对人工智能所增加的电力需求,并确保数据不会因过热、断电或火灾而丢失。
人工智能推理市场潜力巨大
人工智能模型主要分为两类,每类模型具有不同的数据中心要求:
- 人工智能训练:构建模型来识别模式并根据输入数据进行预测。这一过程对延迟不太敏感,可在较为隔离的乡村数据中心进行,利用较低的土地成本。
- 人工智能推理:用于根据输入数据生成预测或输出(如ChatGPT)。需要极高的性能和极低的延迟,以实现最终用户和应用程序的实时交互。更适合设在城市中心的数据中心。
尽管人工智能训练模型目前较为常见,但推理领域的市场潜力可能是训练领域的10至15倍。1其数据中心所需功率密度仅为训练的一半,并可能需要在全球20-30个地点进行复制。
电力限制:数据中心的掣肘
数据中心建设面临土地可用性和电力限制的挑战。因此,需求持续超过可用供应,预计这一趋势将持续。
尤其是电力可用性,公用事业通常只能应对线性增长,而人工智能数据中心所需的阶跃函数式增长带来挑战(见图1)。2023年全球数据中心电力消耗量达60吉瓦。预计2027年达到122吉瓦,相当于复合年增长率(CAGR)约20%。2
图1 - 电力需求激增
数据中心电力供需情况,实际和预测数据,吉瓦
人工智能应用的普及是数据中心电力需求激增的关键原因之一。其服务器能源密度3显著高于传统中央处理器(CPU)服务器。它们依赖于图形处理器(GPU)服务器,所需电力和热量产出皆为传统CPU服务器的五倍以上。4
预计未来15年,80%的数据中心电力将由人工智能消耗。5
目前,数据中心平均每机架功率密度约10千瓦,预计未来几年将提升至40-50千瓦。6
随着人工智能应用增多,运营商将需要升级电力基础设施,这可能需数年时间实施。选择已具备基础设施的地区进行建设是一种加速方式,即便需改装或更换现有结构。
由于人工智能应用在运行过程中产生大量热量,数据中心必须投资于高效的热管理系统(如冷却系统、气流管理),以维持最佳运行温度,防止硬件故障并确保性能可靠。
图2 - 液体冷却
数据中心热管理潜在市场总规模,十亿美元
目前,大多数数据中心采用空气冷却。但随着服务器密度的增加,空气冷却系统的能力已接近极限,一般为每个机架15-25千瓦。7因此,运营商正逐渐转向液体冷却技术。
尽管数据中心设计曾依靠局部冷却技术来满足功率密度要求,现在越来越多的关注转向液体冷却解决方案,以应对生成式人工智能对更大机架密度的需求。随着生成式人工智能日益普及,对旧设施的冷却和改装需求预计将显著增加。
数据中心液体热管理市场在未来五年内有望增长约五倍(图2)。此外,斯特拉斯堡数据中心火灾事件突显了有效冷却系统的重要性,进一步强调了优化冷却系统的迫切性。因此,提供冷却系统或相关设备的公司可以成为具吸引力的投资机会。
数据中心,正值风口
2023年,数据中心经历了前所未有的增长。全球租赁的增量容量超过6吉瓦,其中北美地区占大部分(约4至5吉瓦)。8该租赁量是2022年的两倍,也是2019年的八倍。9
由于供应限制和强劲需求,数据中心运营商的租金在2023年租金同比上涨了18.6%,世邦魏理仕(CBRE)预测2024年租金将继续两位数百分比的上涨(图3)。
图3 - 租金收入
一级市场数据中心平均要价租金,美元/千瓦/月,以及年同比变化
人工智能技术的广泛采用预示着数据中心行业未来几年将呈指数级增长。对广泛的数据处理能力和高性能计算基础设施的需求是推动这一增长的主要原因。此外,为确保人工智能硬件的可靠性和效率,对液体冷却等有效冷却解决方案的需求也会上升。
如果数据中心公司能够调整并扩展其基础设施以满足这些不断发展的需求,他们将能够占据有利位置,充分利用人工智能部署带来的机会。通过适应这些变革,数据中心公司可以在塑造创新的未来及确保数据安全方面发挥关键作用。