使用NVCC编译时,Gencodes(’-gencode
‘)后带arch和code参数。arch标志(’arch
‘)指定了CUDA文件将被编译的英伟达(NVIDIA®)GPU架构名称,code标志(’code
‘)指定了GPU算力。例如 (’-gencode arch=compute_75,code=sm_75
‘)
以下是 NVIDIA GPU 架构名称及其算力对照表:
Fermi † | Kepler † | Maxwell ‡ | Pascal | Volta | Turing | Ampere | Ada | Hopper | Blackwell |
---|---|---|---|---|---|---|---|---|---|
sm_20 | sm_30 | sm_50 | sm_60 | sm_70 | sm_75 | sm_80 | sm_89 | sm_90 | sm_95 |
sm_35 | sm_52 | sm_61 | sm_72 (Xavier) | sm_86 | sm_90a (Thor) | ||||
sm_37 | sm_53 | sm_62 | sm_87 (Orin) |
† 从 CUDA 9 和 11 开始,Fermi 和 Kepler 已被弃用
‡ 自 CUDA 11.6 起,Maxwell 已被弃用