携手Redfish,浪潮信息M6系列服务器打开运维管理的上帝视角

随着5G、人工智能、云计算、大数据等新兴技术的快速发展,数据正在经历爆炸式增长,对算力规模和算力能力的需求也在快速提升,数据中心正向规模化、集约化、绿色化方向发展,这对数据中心的建设、运维和管理都提出了更高的要求。

尽管许多企业对在数据中心的投资十分重视,但却往往却忽略了后期运营管理的成本,在提高计算力部署的同时,后期的运维和管理同样重要。为此,浪潮信息M6服务器采用自主研发的服务器远程管理系统ISBMC,可提供硬件状态监控、部署、节能、安全等系列管理工具,ISBMC已支持多种管理接口,包括IPMI2.0、SNMPv3、WebGUI和基于RESTful架构的Redfish等接口,通过多种保障来强化服务器自身的管理能力,构建现代数据中心的可靠基础,帮助用户高效地管理算力平台。

从1988年讲起,为了解决需要人工在数据中心现场运维服务器的困境,行业推出了IPMI作为行业标准,它指定了一组接口,以提供独立于主机系统的CPU、固件和操作系统(OS)的带外管理和监视功能。然而,由于技术不断发展优化,有越来越多碎片化的需求,特定的解决方案不能满足向外扩展的数据中心用户的功能和安全需求,IPMI也在2015年后便不再更新。此后迎来了Redfish的新时代。

Redfish是由国际标准化组织DMTF发布的开放式行业标准规范,旨在对平台硬件进行现代化和安全的管理,由多个软硬件厂商参与,在标准设立之初就设定了四项基本目标:安全、高可扩展管理、可读取界面、基于现有硬件可实现。目前,浪潮信息已成为DMTFLeadership会员和RedfishPromoter会员。Redfish标准的应用让众多互联网、通信、金融客户可以更方便快捷地对超大规模的数据中心进行管理和运维。标准开放的接口,为客户数据中心构建了一个开放的生态,大幅度降低运维难度,但基础的功能实现却不是浪潮信息研发团队的目标,“源于开源、高于开源”,让生态拥有更强的活力,为客户带来更多价值,才是浪潮信息服务器研发团队引入Redfish的“本心”。

据统计,企业IT设备的更新频率一般是3-5年,那就意味着每台服务器的生命周期要达到3年以上,可想而知,周而复始每天对服务器状态进行不间断监控,定期对服务器出具安全性能检测报告,特别对于超大规模数据中心而言,无疑是需要投入大量的人力和精力。所以,浪潮信息的工程师决定通过优化产品设计,寻求突破。

想打造具有高可靠、高可维护性的服务器,以解决上述超大规模数据中心客户的运维难题,就要用好Redfish的特性,通过覆盖Public、AccountService、SessionService、Chassis、Systems、Managers、UpdateService、TaskService等功能模块,定义不同接口的URL,让服务器的管理实现模块化和精细化。

依托自身技术优势,浪潮信息在M6系列服务器ISBMC固件上遵照Redfish1.8.0规范和Redfish2019.2Schema进行开发,ISBMC不仅在Redfish标准的节点资源有较高的覆盖率,还结合浪潮服务器自身特性功能及客户领先性诉求,进行功能开发,如通信行业客户对包括lldpService、电源设置、部件信息获取与设置服务器在内的上百个需求功能点,以及头部科技行业客户的通电开机策略、多个Redfish故障诊断需求等。

为了让更多的企业也能受益于先进技术,浪潮信息将先进功能整合到ISBMC通用版中,并增加更多系统监控动作,以帮助客户解决运维和管理难题。包括用户管理、服务器信息获取、模块信息管理、服务器配置、BIOS修改、固件升级等功能。此外,还可提供硬件状态监控、部署、节能和安全等系列管理工具,已建立标准化接口的完善服务器管理生态系统,确保服务器底层硬件和固件的安全。

浪潮信息独创了一种异步多线程Redfish架构,实现了高度模块化,可快速移植到多平台。其接口性能参数具有30%以上的提升,并且其API平均响应小于100毫秒。

为了简化运维工作,浪潮工程师在从数据中心整体运维的角度进行思考,通过与大量客户的交流发现,数据中心的运维工作往往集中在问题爆发后的解决过程中。这给运维人员的工作造成了巨大的挑战,并且一旦问题发生,必将对业务造成影响。为了解决这一问题,浪潮信息推出了ISPIM,这是一个面向数据中心的集中管理软件,采用了Redfish作为主要通信协议,具备资源管理、故障监控、性能监控、能源管理、自动部署、报表统计、网络拓扑和3D视图等功能。

ISPIM可以对数万台不同品牌的服务器、存储和网络设备进行统一监控和运维,并提高运维效率。此外,基于浪潮信息的大数据规则故障诊断功能,可将故障诊断准确率提升至93%,并在快速处理故障的同时降低数据泄露风险。这有助于用户打造无人值守数据中心,提高运维效率并降低运维成本,确保数据中心的安全、可靠和稳定运行。

最终,浪潮信息的M6系列服务搭配ISPIM管理软件,可以满足企业从单一产品到超大数据中心的全链条管理优化需求,为业务提供高效可靠的运行基础。