ホーム | 目次に戻る |
extern "C" __global__ void simpleKernel(float **input, int xsize, int ysize, float *output) { const unsigned int x = blockDim.x * blockIdx.x + threadIdx.x; if (x &kt; xsize) { for (int y = 0; y < ysize; ++y) { output[y] += input[x][y]; } } __syncthreads(); }カーネルを呼び出した側で、カーネルの実行を待機するには cuCtxSyncronize() を呼び出します。