GUIDE
导读
AI时代,AIGC等创新技术应用推动算力快速增长,计算架构正在由CPU密集型转向GPU、FPGA、ASIC芯片的加速计算密集型,对数据中心计算系统的安全性、性能、能耗、自动化和智能化水平等方面都提出了更高的要求。固件作为计算机系统中协调硬件与软件的关键桥梁,是支撑计算产业演进的重要支柱。固件的持续优化和更新是保障计算系统适应AI时代新应用,提高系统整体性能,提升大规模数据中心运维效率的重要工具。
机遇与挑战并存 产业上下游携手同行
智能故障诊断及运维,开启数据中心的AI运维创新
随着数据中心规模的不断扩大,百万级设备的故障自动化和智能化运维也给固件创新提出了新的挑战。为提升服务器硬件故障自动化和智能化水平,目前字节跳动固件研发团队已经开展了数据中心故障诊断的研发创新,字节技术专家李琛琛表示,目前字节定义了数据中心故障分析的问题焦点,比如CPU、主板、内存、网卡等等,并针对固件采集到的故障问题,海量数据,运用AI建立了故障分析和处理的整个体系,更好帮助数据中心的故障诊断以及预测。字节技术专家高静也从硬件问题数据的采集、标准化、定位问题模式样、以及内存故障的预测等方面,进一步阐述了字节跳动硬件故障智能运维的运行机制。
开源开放,数据中心固件创新进入开放时代
随着AI、云计算等技术的快速发展,算力需求爆发,服务器设计呈现多元异构特征,对服务器的固件而言,无论是BMC监控管理计算系统还是BIOS系统启动和各项参数的定义,都需要去快速适配多种通用计算处理器、多种异构加速器和各类部件,才能实现服务器高效、稳定、可靠运行。联想的固件高级经理曹光耀分享《Linuxboot的应用和展望》过程中详细介绍了关于BIOS系统的Linuxboot开源技术及其强大的各项应用实践,比如Linuxboot的应用对于装机效率的提升,并表示希望不断完善Linuxboot的开源生态,找到Linuxboot的客户价值点,让开源的Linuxboot发挥最大的作用,为用户的OS交好最后一棒。
在技术沙龙的圆桌对话上,来自阿里、中国电子技术标准化研究院、Insyde、昆仑太科、以及浪潮信息的五位专家也共同交流了关于AI时代性固件技术发展面临的机会和挑战,OpenBMC开源开放的趋势,开源和标准对推动固件产业技术创新,加快固件技术迭代的作用,以及未来固件创新在开源方向的机会等。
加强固件技术的产业开放与创新,是推动计算产业系统升级的关键一环。此次固件产业技术创新联盟技术沙龙不仅聚焦推动AI时代下固件技术创新和标准建立,更为芯片厂商、固件厂商、系统厂商和用户全产业链企业搭建了交流与学习平台。未来,联盟将持续发挥技术交流与合作的桥梁作用,为推动固件产业的健康发展,促进计算产业的系统化升级起到关键性的推动作用。
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
加入交流群
请使用微信扫一扫!