中国测试  2019, Vol. 45 Issue (8): 50-54, 66

文章信息

李皓琰, 韩明超, 臧战胜, 张朋波
LI Haoyan, HAN Mingchao, ZANG Zhansheng, ZHANG Pengbo
服务器设备抗震性能测试分析
Anti-seismic performance test and analysis of the server
中国测试, 2019, 45(8): 50-54, 66
CHINA MEASUREMENT & TEST, 2019, 45(8): 50-54, 66
http://dx.doi.org/10.11857/j.issn.1674-5124.2018060005

文章历史

收稿日期: 2018-06-03
收到修改稿日期: 2018-08-20
服务器设备抗震性能测试分析
李皓琰 , 韩明超 , 臧战胜 , 张朋波     
中国信息通信研究院泰尔系统实验室,河北 保定 071000
摘要:为研究服务器设备的抗震性能,保障地震灾害中信息通信网络业务和数据的安全可靠性,该文构建一种服务器抗震技术性能检测和评估方法。包括震前震后服务器的外观和硬件检查、状态监控功能测试、运行可靠支持功能检查和设备性能指标检查。并基于地震模拟振动台,依据电信设备抗地震性能检测规范,通过抗震试验首次对某型号服务器的设备频率、设备结构、外观及硬件、基本功能、系统性能等进行抗震性能测试和方法验证。通过对抗震试验结果的分析,验证服务器抗震技术性能检测和评估方法的可行性和科学性,并为后续服务器抗震性能研究和标准制定提供基础数据和参考依据。
关键词服务器    抗震测试    结构性能    技术性能    
Anti-seismic performance test and analysis of the server
LI Haoyan , HAN Mingchao , ZANG Zhansheng , ZHANG Pengbo     
CTTL-systems, China Academy of Information and Communications Technology, Baoding 071000, China
Abstract: In order to study the anti-seismic performance of server equipment to guarantee the safety and reliability of the communication network service and data during the earthquake, the anti-seismic technical performance test and evaluation method including the appearance and hardware check, condition monitoring function test, reliable operation support function test and performance test of server before and after seismic test has been established. And the seismic test based on the shaker table has been conducted according to specification for seismic test of telecommunications equipment to test the frequency, the structure, the appearance and hardware, the basic function and system performance of the server to analyze the anti-seismic performance for the first time. Through the analysis of the test results, the feasibility and scientificity of the anti-seismic technical performance test and evaluation method has been verified which provides basic data and reference to the following research and standard establishment.
Key words: server     seismic test     structure performance     technical performance    
0 引 言

服务器是通信系统的主要组成部分,是提供特定应用服务的计算机系统[1]。在大数据和云计算背景下,服务器设备在IT、政府、金融、电信等领域广泛应用,承载着关键的服务和数据任务,因此服务器的安全可靠性至关重要。我国地震频繁,震级高、震源浅,地震对全程全网的通信网破坏严重[2],根据调研情况,服务器在地震中机柜、设备主体、各元器件和连接件会受到严重影响。同时,地震所引起的振动冲击会导致服务器广泛使用的机械式磁盘磁头偏离磁道运动[3],不具备抗震性能的设备在震动时会造成磁盘损坏,导致数据永久丢失,严重影响通信网正常运行。

目前,国内外有针对通信设备的通用结构性能抗震检测标准[4-10],但针对服务器的抗震技术性能检测标准和抗地震性能研究还处于空白状态。为了研究服务器的抗震性能,制定科学的抗震技术性能检测标准,保证地震中重要数据的安全,保障灾后通信正常,本文构建了服务器抗震技术性能检测和评估方法,基于地震模拟振动台,依据YD5083-2005《电信设备抗地震性能检测规范》对某型号服务器设备进行了地震试验,通过检测其设备频率、设备结构、基本功能和系统性能,分析了其抗震性能,为后续服务器设备抗震研究和标准制定提供数据和技术参考。

1 抗震试验设备及方案

服务器设备抗震性能检测目的是检验服务器设备在设防地震作用下的运行功能,验证服务器设备在经受一定强度地震后,能够实现其原有设计功能的能力。针对被测服务器设备,地震台输入标准的模拟人工合成地震波,对其结构和技术性能进行综合性考核。

1.1 试验设备

本次抗震试验设备主要包括三向地震模拟振动台、数据采集分析系统、BurnInTest/IOmeter服务器测试软件等。被测设备为数据中心机房中广泛使用的某型号2U机架式服务器,主要参数如表1所示。

表 1 被测服务器硬件配置1)
类别 名称 数量
主板 双路CPU主板 1
HBA 12 GB 2端口SAS HBA卡SAS RAID控制卡 1
CPU INTEL Skylake Xeon platinum 8170 M 2
内存 Micron 2666 MHz DDR4 16 GB 24
电源 12 A主备电源模块 2
硬盘 2.5 inch 600 G SAS 机械硬盘 29
硬盘 3.5 inch 8 T SATA HDD机械硬盘 2
风扇 智能冗余风扇 6
外形尺寸 445.4 mm(宽)×768.5 mm(深)×87.5 mm(高)
质量 29.4 kg
注:1) 1inch=0.025 4 m。

1.2 试验方案

参考YD5083-2005对上述服务器设备依次进行7、8、9烈度抗震试验。试验安装环境如图1所示,每个烈度抗震试验步骤按图2所示进行。

图 1 服务器设备安装示意图

图 2 抗震试验步骤

1)抗震试验前,对服务器的物理结构和技术性能进行检查。检查服务器的结构,确保服务器没有结构方面的损伤。同时,按制定的服务器抗震技术性能检测和评估方法进行技术性能测试,包括服务器外观、基本功能测试和关键部件性能测试,以验证服务器设备在震前完好。

2)模拟实际安装方式和工作方式。根据YD5083标准规定,对于插框类设备,需将其安装固定在试验机架内,质量在25~70 kg的插框类设备需要安装在试验机架中部。本试验将被测服务器设备通过配套导轨安装到标准19 inch试验机架中部,试验机架水平X轴主频为26 Hz,水平Y轴主频为30 Hz,垂直Z轴频率34 Hz,符合主流机架频率水平,具有足够的刚性保证测试有效性。然后将装有服务器设备的机架按实际安装方式安装到振动台台面,正常加电运行,并使用BurnInTest[11]软件加压模拟实际运行负载进行抗震测试。

3)在服务器设备上贴装三轴向加速度传感器,对服务器设备进行震前动力特性检查,测定被测服务器设备震前的固有频率、阻尼比等动力特性参数,并记录检查结果。

4)按照对应的考核烈度生成对应的人工地震波,对设备进行人工地震波考核,并记录考核过程中各测点的加速度值。

5)对服务器设备进行震后动力特性检查。测定被测服务器设备震后的固有频率、阻尼比等动力特性参数,并记录检查结果。

6)检查震后服务器的物理性能和技术性能。对服务器进行震后结构检查和震后技术性能测试。方法同第1)步。

2 试验方法和结果分析

按照YD5083要求,被测服务器设备在进行抗地震性能考核后,在7、8、9烈度地震作用下,都不得出现任何设备组件如导轨及外壳的脱离、脱落和分离,被测设备结构不得有变形和破坏。同时,各项技术性能指标均应符合技术性能检测标准的要求。

2.1 结构性能

2.1.1 服务器设备动力特性

在各烈度试验的震前和震后,分别对服务器设备进行频率范围1~50 Hz,加速度幅值0.1 g的白噪声激励测试,以此来检查其动力特性。测试采用单轴激励方式,包括设备的正面方向(X向),侧面方向(Y向)和垂直方向(Z向)。7、8、9烈度被测服务器设备震前和震后动力特性测试结果变化对比如图3~图8所示,一阶固有频率如表2所示。

图 3 7烈度前后X向动力特性曲线对比图

图 8 9烈度前后Y向动力特性曲线对比图

表 2 各烈度前后一阶固有频率
状态 7烈度 8烈度 9烈度
X Y X Y X Y
震前 20.313 7.031 19.727 7.031 19.531 6.836
震后 20.057 7.005 19.445 6.393 19.481 5.674

图 4 7烈度前后Y向动力特性曲线对比图

图 5 8烈度前后X向动力特性曲线对比图

图 6 8烈度前后Y向动力特性曲线对比图

图 7 9烈度前后X向动力特性曲线对比图

由图表分析可知,在7烈度抗震试验考核前后,被测设备动力特性固有频率无明显变化;在8、9烈度抗震试验考核中,被测设备受加速度较大,产生一定疲劳,固有频率有轻微下降。综上所述,被测设备固有频率无明显突变,说明该服务器具有良好的结构稳定性。

2.1.2 服务器抗震性能考核

按照标准规定的要求反应谱(RRS)生成人工地震波时域波形,用此时域波形对服务器进行地震波考核,考核在XYZ向分别进行。

水平X向和Y向输入波形加速度计算式为

${a_{\rm H}} = {k_1} \times {k_2} \times {a_1}$ (1)

式中:aH——水平向输入波形加速度;

k1——设备重要度系数;

k2——建筑物楼面加速度放大倍率;

a1——地面加速度。

因服务器设备属于通信设备,按YD5083标准要求通信设备重要度系数取值1.1,建筑物楼面加速度放大倍率取值3,地面加速度按7、8、9烈度分别取值0.1 g、0.2 g和0.4 g。通过以上可计算出,服务器设备7、8、9烈度抗震试验输入最大加速度分别为0.33 g、0.66 g、1.32 g

垂直向输入波形加速度计算式为

${a_{\rm v}} = \frac{1}{2} \times {a_{\rm H}}$ (2)

式中av为垂直向输入波形加速度。

由于地震波产生的地面加速度的卓越频率主要分布在5~20 Hz范围内,超出该范围的对设备影响较小。按照标准规定,如果在动力特性检查中得到的设备垂直向固有频率高于20 Hz,则可只做水平向的抗地震性能考核。被测服务器设备震前垂直向动力特性测试固有频率大于20 Hz,故未进行垂直向抗震性能考核。

根据上述值输入最大加速度,输入人工合成地震波,被测服务器设备响应加速度曲线如图9~图11所示,从图中可以看到7烈度加速度幅值较低,8、9烈度加速度幅值较高,并且Y向响应大于X向响应,与设备动力特性表现一致。经7、8、9烈度抗震考核后,被测服务器设备导轨及安装螺丝无脱离脱落和分离情况,设备结构无变形和破坏情况。

图 9 7烈度设备响应时程图

图 11 9烈度设备响应时程图

图 10 8烈度设备响应时程图

2.2 技术性能

2.2.1 外观及硬件检查

外观和硬件的完整可靠能最直观体现设备整体设计是否符合抗震要求,服务器表面应无明显凹痕、裂缝、变形,服务器的零部件紧固无松动,可插拔部件连接可靠,开关、按钮和其他控制部件灵活可靠。各烈度震后,经测试检查,被测服务器设备外观正常,各部件灵活可靠无松动。

2.2.2 状态监控功能测试

监控功能是服务器的重要功能,能够远程监控服务器设备的运行状态,及时了解震后服务器各硬件是否正常。服务器能够通过可管理接口收集电源、风扇、处理器、磁盘控制等关键部件的运行状态,如处理器工作温度、风扇转速、系统核心电压等,并对其进行实时监控。当所监测数据超过预先设定的故障阈值时,提供告警信息。故障消除后,提供状态恢复信息。此项测试考核各监控总线连接和接口在地震试验中的可靠性。

试验方法为在各烈度抗震性能考核后,人为设置产生紧急告警或用人机命令修改硬件故障阈值,检查被测服务器监控功能能否对不同类型的故障产生告警信号,并实时显示、上报,对已产生告警信号进行恢复时,告警信息应复原。各烈度震后,经测试检查,被测服务器设备状态监控功能正常。

2.2.3 运行可靠支持功能检查

运行可靠支持功能是指能够支持冗余功能,冗余功能能够保证服务器震后可靠运行。服务器采取可靠支持设计的关键部件如电源、风扇、硬盘等应支持容错、冗余和热插拔功能,热插拔设备的现场可更换单元时,系统监控应显示告警故障信息和告警故障恢复信息,同时该部件热插拔应不影响系统其他硬件正常工作,系统持续可靠运行。此项考核服务器冗余切换功能在地震试验中的可靠性。

试验方法为在各烈度抗震性能考核后,人为将配置为冗余状态、支持热插拔的部件组中(如风扇、电源、磁盘、PCI插槽等)任意一个移出,检查冗余功能,指示和报警功能是否工作正常,系统是否持续可靠运行。待重新插入冗余部件后,检查系统监控是否显示故障和恢复信息。各烈度震后,经测试检查,被测服务器设备冗余功能正常。

2.2.4 设备性能指标检查

由于服务器设备CPU、内存、显卡等关键部件安装方式为插接,连接具有特殊性,性能指标检查能够反映抗震性能考核过程中CPU、内存等关键部件是否松动。同时,由于机械硬盘组成结构对震动十分敏感,性能指标检查能够反映抗震性能考核过程中硬盘是否出现读写错误和物理坏道,造成性能下降。服务器的主要功能单元CPU、内存、存储系统等硬件状态正常,性能测试结果正常。

试验方法为在各烈度抗震性能考核后,用BurnInTest和IOmeter[12]软件对服务器关键部件CPU、内存和硬盘进行性能测试。各烈度震后,经检查,被测服务器设备CPU、内存性能正常,机械硬盘性能测试结果如图12图13所示,变化幅度小于0.2%,性能较稳定。

图 12 不同烈度考核后与震前存储系统IOPS性能变化图

图 13 不同烈度考核后与震前存储系统吞吐量性能变化图

3 结束语

本文建立了服务器的抗震技术性能检测和评估方法,主要包括震前震后对服务器的外观和硬件检查、状态监控功能测试、运行可靠支持功能检查和设备性能指标检查。依据该方法能够有效检测服务器设备是否具有抗震性能,具有较好的可执行性和科学性。通过对抗震试验结果分析,为后续服务器抗震性能研究和服务器抗地震性能检测规范的制定提供了基础数据和参考依据。后续将对地震环境中硬盘的工作状态进行研究,以完善服务器抗震性能检测规范中对硬盘的性能评估方法。

参考文献
[1]
计算机通用规范第3部分: 服务器: GB/T 9813.3-2017[S]. 北京: 中国质检出版社, 2017.
[2]
韩明超, 李皓琰. NB-IoT基站抗地震性能测试与研究[J]. 电信技术, 2018(3): 7-9. DOI:10.3969/j.issn.1000-1247.2018.03.002
[3]
NIWA H, FUKUI H, SASAKI Y, et al. Seismic evaluation of magnetic disk drives[J]. Transactions of the Japan Society of Mechanical Engineers (Part C), 1996, 62(11): 4161-4167.
[4]
电信设备抗地震性能检测规范: YD 5083-2005[S]. 北京: 北京邮电大学出版社, 2006.
[5]
Physical protection, telcordia technologies generic requirements: GR-63-CORE Issue4[S]. New Jersey: Telcordia Technologies, Inc, 2012.
[6]
Network equipment-earthquake resistance: ATIS-0600329.2014[S]. Washington DC: Alliance for Telecommunications Industry Solutions, 2014.
[7]
Environmental engineering(EE); environmental conditions and environmental tests for telecommunications equipment; part2-3: Specification of environmental tests; Stationary use at weatherprotected locations: ETSI EN 300 019-2-3 V2.2.2[S]. European Telecommunications Standards Institute, 2003.
[8]
Earthquake resistance test specifications for communications equipment[S]. Japan: NTT DOCOMO, INC, 2018.
[9]
Environmental testing part3: guidance seismic test methods for equipments: IEC 68-3-3[S]. International Electrotechnical Commission, 1991.
[10]
Mechanical structures for electronic equipment-Tests for IEC 60917 and 60297-Part 2: Seismic tests for cabinets and racks: IEC 61587-2[S]. International Electrotechnical Commission, 2011.
[11]
BurnInTest for Windows[EB/OL]. Sydney: PassMark Software Pty Ltd, 2015[2018-05-21]. https://www.passmark. com.
[12]
Iometer user’s guide[EB/OL]. California: Intel Corporation, 2003[2018-05-25]. http://www.iometer.org.