赋能开发者,英特尔发布oneAPI 2022工具包

2021年12月23日,英特尔在美国加州圣克拉拉发布了oneAPI2022工具包,该工具包的最新版本扩展了跨架构开发的特性,提供了更广泛的架构选择和更强的实用性,以加速计算。

英特尔公司首席技术官、高级副总裁、软件和先进技术事业部总经理GregLavender表示:“我对oneAPI软件工程团队完成的900多项技术改进深感敬佩,这些改进加速了关键应用工作负载在英特尔的客户端和服务器CPU和GPU上的开发时间和性能。oneAPI套组的深入技术创新符合关键的行业标准,为应用程序开发者提供从云到边缘更高效的运行性能。今天发布的oneAPI2022版本已准备好多语言支持和跨架构性能加速,以进一步提高英特尔平台上程序员的生产力。”

oneAPI新工具包包括第一款能够执行C++、SYCL和Fortran的统一编译器,用于CPU和GPU的DataParallelPython,先进的加速器性能建模和调试,以及用于AI和光线追踪可视化工作负载的性能加速。oneAPI跨架构编程模型为开发者提供了工具,旨在构建跨架构应用程序时提高代码开发的效率和速度的工具。

据EvansData的调查显示,40%的开发者需要在异构系统上使用一种以上的处理器、处理器内核或协处理器[1]。oneAPI正在推动跨CPU、GPU、FPGA及其他加速器的异构构造中的跨架构计算创新,加速其步伐。跨架构计算创新需要软件将其中要素组合成一个完整的解决方案。oneAPI让开发者可以自由地为特定解决方案选择最佳硬件,而无需承担专有编程模型的经济和技术负担。

2022年英特尔®oneAPI工具包提供了一套完整的先进工具,包括编译器、库、预优化框架、分析器和调试器,以提高性能和生产力。自去年以来,该工具包增加了超过900个新的和增强的功能,并加强了基础和特定领域工具包中的每一个工具。新版本现在可以在英特尔®DevCloud中免费下载或使用。

英特尔创建了世界领先的统一编译器,并使用通用的LLVM后端实现了用于CPU和GPU的C++、SYCL和Fortran。同时,在CPU和GPU上对目前最流行的编程语言Python进行了加速计算。英特尔®DPC++兼容性工具现在可以将90%至95%的CUDA代码自动迁移到SYCL/DPC++[2]。

该工具包通过优化支持最新和即将推出的新硬件的先进功能,包括具备AVX-VNNI的第12代英特尔®酷睿™处理器,具备英特尔®高级矩阵扩展(AMX)的下一代英特尔®至强®可拓展处理器代号SapphireRapids,以及即将推出的Xe客户端和数据中心GPU。

凭借最新的英特尔®TensorFlow优化版和英特尔®PyTorch优化版,深度学习框架性能比早期版本提高了10倍[3]。全新的英特尔®Scikit-learn扩展包(Intel®ExtensionforScikit-learn)在英特尔CPU上的机器学习算法相比现有开源版本提高了超过100倍[4]。英特尔还推出了英特尔®神经网络压缩器(Intel®NeuralCompressor),该压缩器通过跨多个深度学习框架训练后的优化技术来提高推理性能。

英特尔®VTune™Profiler的FlameGraph显示是专业针对CPU及加速器的性能分析工具,可提高性能热点的可视化能力。

英特尔® Advisor的加速器性能建模让开发者能在修改代码前预先评估卸载到GPU之后所带来的性能提升。此外,该技术还支持先进光线追踪技术中的锥体遥测、辅助特征降噪和FP16等新功能,从而提供更强大的形状,同时也缩短了渲染时间,提高了整体渲染性能。同时,该技术还为即将发布的英特尔XeGPU实时去噪提供支持,进一步提升了业界领先、最终帧、产品化质量的渲染效果。

此外,还扩展了开发环境的支持范围,包括更深层次的MicrosoftVisualStudioCode集成、对MicrosoftVisualStudio2022的支持以及适用于Linux开发的Windows子系统MicrosoftWSL2。