12 月 10 日消息,英伟达(NVIDIA)公司于近日发布了 CUDA 12.0 开发工具更新。本次更新带来了非常多的改变,包括支持最新的 Hopper 和 Ada Lovelace GPU 架构、升级 C++ 方言(Dialects)、正式支持 JIT LTO、改善和引入新的 API 等等。
CUDA 12.0 主要功能介绍如下
CUDA 12.0 为 NVIDIA 的 Hopper 和 Ada Lovelace 架构提供可编程功能。CUDA 12 为 Hopper 和 Ada 架构提供了很多张量操作(tensor operation)选项,这些选项很多都支持公共 PTX 中间表示法。合作网格阵列(CGA)支持 C 内置函数,用于 SM 多投的编程式二级缓存,基因组学 / DPX 指令,以及其它新增功能。
支持对标记为 CUDA_VISIBLE_DEVICES 的 GPU 使用虚拟内存管理 API。
应用程序和库开发人员可以以编程方式更新 CUDA 流的优先级。
改良后的 CUDA 动态平行化 API,与之前的 API 相比,性能有了 "实质性" 的提高。
现在通过 nvJitlink 库正式支持即时链接优化(JIT LTO)。
支持 GCC 12.1 主机编译器。
NVCC 和 NVRTC 对 C++20 方言的支持。
NVRTC 将其默认的 C++ 方言从 C++14 更新为 C++17。
更多关于 CUDA 12.0 变化的细节请参见发布说明。用户和开发者可以从 developer.nvidia.com 下载适用于所有主要平台的 CUDA 12.0。