pscfpp-man/LinearAlgebra_8cu_source.html

#ifndef PSPG_LINEAR_ALGEBRA_CU

#define PSPG_LINEAR_ALGEBRA_CU


#include "LinearAlgebra.h"


namespace Pscf {

namespace Pspg {


__global__ void subtractUniform(cudaReal* result, cudaReal rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] -= rhs;

   }

}


__global__ void addUniform(cudaReal* result, cudaReal rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] += rhs;

   }

}


__global__ void pointWiseSubtract(cudaReal* result, const cudaReal* rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] -= rhs[i];

   }

}


__global__ void pointWiseSubtractFloat(cudaReal* result, const float rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] -= rhs;

   }

}


__global__ void pointWiseBinarySubtract(const cudaReal* a, const cudaReal* b, cudaReal* result, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] = a[i] - b[i];

   }

}


__global__ void pointWiseAdd(cudaReal* result, const cudaReal* rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] += rhs[i];

   }

}


__global__ void pointWiseBinaryAdd(const cudaReal* a, const cudaReal* b, cudaReal* result, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] = a[i] + b[i];

   }

}


__global__ void pointWiseAddScale(cudaReal* result, const cudaReal* rhs, double scale, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] += scale * rhs[i];

   }

}


__global__ void inPlacePointwiseMul(cudaReal* a, const cudaReal* b, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for(int i = startID; i < size; i += nThreads) {

      a[i] *= b[i];

   }

}


__global__ void pointWiseBinaryMultiply(const cudaReal* a, const cudaReal* b, cudaReal* result, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for (int i = startID; i < size; i += nThreads) {

      result[i] = a[i] * b[i];

   }

}


__global__ void assignUniformReal(cudaReal* result, cudaReal uniform, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for(int i = startID; i < size; i += nThreads) {

      result[i] = uniform;

   }

}


__global__ void assignReal(cudaReal* result, const cudaReal* rhs, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for(int i = startID; i < size; i += nThreads) {

      result[i] = rhs[i];

   }

}


__global__ void assignExp(cudaReal* out, const cudaReal* w, double constant, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;

   for(int i = startID; i < size; i += nThreads) {

      out[i] = exp(-w[i]*constant);

   }

}


__global__ void scaleReal(cudaReal* result, double scale, int size)

{

   int nThreads = blockDim.x * gridDim.x;

   int startID = blockIdx.x * blockDim.x + threadIdx.x;


   for (int i = startID; i < size; i += nThreads) {

      result[i] *= scale;

   }

}


}

}

#endif

Pscf::Pspg::ThreadGrid::nThreads
int nThreads()
Get the number of threads per block for execution.
Definition: ThreadGrid.cu:173

Pscf
C++ namespace for polymer self-consistent field theory (PSCF).
Definition: BlockDescriptor.cpp:11