CUDA:实现使用驱动API从PTX即时编译Kernel。并展示了运行时和驱动API互操作性的无缝衔接
以下是一个展示在CUDA中使用驱动API从PTX即时编译内核,并展示运行时和驱动API之间无缝衔接的示例代码:
#include <iostream>
#include <cuda_runtime_api.h>
#include <cuda.h>
#include <nvrtc.h>
#define CUDA_SAFE_CALL(call) \
do { \
cudaError_t error = call; \
if (error != cudaSuccess) { \
std::cerr << "Error: " << cudaGetErrorString(error) << '\n'; \
exit(EXIT_FAILURE); \
} \
} while(0)
#define NVRTC_SAFE_CALL(call)