您的位置:首页 >要闻 >

数据中心的浪浪山

时间:2023-01-18 18:16:08 来源:

2023开年,浪浪山的一只小猪妖火出了圈,在《中国奇谭》这部国漫的第一个单元中,小猪妖踌躇满志,想要做出一番事业,结果费尽千辛万苦,自己的工作成果却被否定,然后,小猪妖说出了那句经典台词“我想离开浪浪山”。

小猪妖的遭遇,戳中了当代打工人的隐痛,也像极了数据中心里那些鲜为人知,又百抓挠心的困境。

数据中心的浪浪山

近年来,我们能够在很多论坛、峰会、发布会商听到一些高瞻远瞩、提纲挈领的话,比如“计算力就是生产力”、“数字经济的基础设施”、“上云用数赋智”等,这些宏观层面的趋势、路线支撑着云数据中心、智算中心等计算集群的快速发展,我们也在此前的文章中分析过很多。

不过,实际建设过程中,会面临这样那样的具体挑战,可能是坐在办公室/研究所,对着PPT指点江山的人很难想象的。

比如西部某高校中计算中心的一个女工作人员曾告诉我,服务器散热主要靠风冷,维持降温会加大送风风力,她们女员工进机房都是没法穿裙子的;机房内的噪音很大,常年负责运维的同事,听力也受到了损害。

这些细节而真实的难题,构成了数据中心必须翻越的浪浪山,否则就会像小猪妖一样疲惫且做无用功,而这些问题,只能从扎根在脚下的土地中来,从与一线人员交流中来。今天我们就结合一些实地见闻来聊一聊,数据中心正在等待翻越哪些山峦。

第一重山:电

谈到数据中心的中美差异,你会想到什么?芯片、架构、软件、产业链?有一个容易被忽略但很重要的因素是:供电。

益企研究院自2018年来实地考察了多个国内云数据中心,发现2 路2U 是国内服务器市场上的主流规格,IDC的服务器市场追踪报告也证实,2018—2021 年,机柜式服务器中2U 规格占据了70%左右。然而,美国市场上,1U反而更受欢迎。

1U和2U究竟是什么?到底是什么原因导致了这种差别?又意味着什么呢?

数据中心的浪浪山

(中国电子信创云基地(顺义)机房的2U服务器)

我们知道,随着IT设备技术的变化,现代数据中心采用的服务器高度一般为1U或2U,U指的是机架式服务器的厚度,1U是4.45厘米,而早期数据中心的机架式服务器高度一般在3-5U。

U的数字越少,服务器高度越低,单机计算密度越高,1U服务器的计算密度可以达到2U服务器的两倍。然而,东数西算工程中对数据中心集群的要求,京津冀、长三角、粤港澳大湾区、成渝这几个枢纽节点都强调了“高密度”。因为只有密度更高,才能在有限的土地面积上供给更多的算力,提高土地资源效益。

这样看,1U应该是更好的选择,但实地走访得到的结果,却是2U规格在中国云数据中心的占比较多,这是为什么呢?这里有一个决定性因素——供电能力。

因为1U比2U更耗电,支撑约18台2U服务器的单机柜供电量需要达到6kW,如果换成部署36台1U服务器,那供电量就要达到12kW。如果单机柜的供电能力达不到,就无法充分发挥1U的密度优势。

数据中心的浪浪山

(和林格尔东方超算云数据中心内景)

而目前,我国数据中心的机柜功率还是普遍偏低的,主流功率以4-6KW为主,“东数西算”工程的宣传中,甚至还可以看到“2.5 千瓦标准机架”的配置,6kW以上的机柜占比只有32%。

数据中心的供电系统,既有旧疾,也有新患。旧疾在于,传统数据中心的各个机电系统分别运行,采集精度不足,调控范围也有限,供电能力和IT需求无法精细化对等,一旦单机柜功率密度加大,电源连续运行的可靠性就可能受到影响,发生停机中断的风险也会增大。对于云服务商来说,云数据中心断电会直接导致客户业务终端,带来经济损失,这是不可承受之重。

新患在于,国家提出“双碳”战略后,建设绿色节能数据中心已经成为共识,而单机功率密度的增加,会直接提高制冷要求,从而增加空调设备和空冷用电。以2021 年数字中国万里行考察过的云数据中心为例,腾讯云怀来瑞北数据中心使用 52U 机柜,UCloud(优刻得)乌兰察布云基地使用 47U 和54U的机柜,如果都改用1U服务器,不仅不能真正提高密度,反而会增大服务器散热设计的挑战。

已知数据中心必须提高计算密度,那就要提高单柜密度,单机柜功率需要更高可靠、高可用的供电能力来保障,因此可以得出,供电能力接下来会是中国数据中心必须翻越的一重山。

123下一页>


郑重声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。