doxygen/html/cu__dense__matrix_8cu_source.html

 /*

  *  SPDX-FileCopyrightText: Copyright 2021, Siavash Ameli <sameli@berkeley.edu>

  *  SPDX-License-Identifier: BSD-3-Clause

  *  SPDX-FileType: SOURCE

  *

  *  This program is free software: you can redistribute it and/or modify it

  *  under the terms of the license found in the LICENSE.txt file in the root

  *  directory of this source tree.

  */


 // =======

 // Headers

 // =======


 #include "./cu_dense_matrix.h"

 #include <omp.h>  // omp_set_num_threads

 #include <cstddef>  // NULL

 #include <cassert>  // assert

 #include "../_cu_basic_algebra/cu_matrix_operations.h"  // cuMatrixOperations

 #include "../_cuda_utilities/cuda_interface.h"  // alloc, copy_to_device, del


 // =============

 // constructor 1

 // =============


 template <typename DataType>

 cuDenseMatrix<DataType>::cuDenseMatrix():

     device_A(NULL)

 {

 }


 // =============

 // constructor 2

 // =============


 template <typename DataType>

 cuDenseMatrix<DataType>::cuDenseMatrix(

         const DataType* A_,

         const LongIndexType num_rows_,

         const LongIndexType num_columns_,

         const FlagType A_is_row_major_,

         const int num_gpu_devices_):


     // Base class constructor

     cLinearOperator<DataType>(num_rows_, num_columns_),

     cDenseMatrix<DataType>(A_, num_rows_, num_columns_, A_is_row_major_),

     cuMatrix<DataType>(num_gpu_devices_),


     // Initializer list

     device_A(NULL)

 {

     this->initialize_cublas_handle();

     this->copy_host_to_device();

 }


 // ==========

 // destructor

 // ==========


 template <typename DataType>

 cuDenseMatrix<DataType>::~cuDenseMatrix()

 {

     // Member objects exist if the second constructor was called.

     if (this->copied_host_to_device)

     {

         // Deallocate arrays of data on gpu

         for (int device_id = 0; device_id < this->num_gpu_devices; ++device_id)

         {

             // Switch to a device

             CudaInterface<DataType>::set_device(device_id);


             // Deallocate

             CudaInterface<DataType>::del(this->device_A[device_id]);

         }


         delete[] this->device_A;

         this->device_A = NULL;

     }

 }


 // ===================

 // copy host to device

 // ===================


 template <typename DataType>

 void cuDenseMatrix<DataType>::copy_host_to_device()

 {

     if (!this->copied_host_to_device)

     {

         // Set the number of threads

         omp_set_num_threads(this->num_gpu_devices);


         // Create array of pointers for data on each gpu device

         this->device_A = new DataType*[this->num_gpu_devices];


         // Size of data

         LongIndexType A_size = this->num_rows * this->num_columns;


         #pragma omp parallel

         {

             // Switch to a device with the same device id as the cpu thread id

             unsigned int thread_id = omp_get_thread_num();

             CudaInterface<DataType>::set_device(thread_id);


             // Allocate device memory and copy data from host

             CudaInterface<DataType>::alloc(this->device_A[thread_id], A_size);

             CudaInterface<DataType>::copy_to_device(this->A, A_size,

                                                     this->device_A[thread_id]);

         }


         // Flag to prevent reinitialization

         this->copied_host_to_device = true;

     }

 }


 // ===

 // dot

 // ===


 template <typename DataType>

 void cuDenseMatrix<DataType>::dot(

         const DataType* device_vector,

         DataType* device_product)

 {

     assert(this->copied_host_to_device);


     // Get device id

     int device_id = CudaInterface<DataType>::get_device();


     cuMatrixOperations<DataType>::dense_matvec(

             this->cublas_handle[device_id],

             this->device_A[device_id],

             device_vector,

             this->num_rows,

             this->num_columns,

             this->A_is_row_major,

             device_product);

 }


 // ========

 // dot plus

 // ========


 template <typename DataType>

 void cuDenseMatrix<DataType>::dot_plus(

         const DataType* device_vector,

         const DataType alpha,

         DataType* device_product)

 {

     assert(this->copied_host_to_device);


     // Get device id

     int device_id = CudaInterface<DataType>::get_device();


     cuMatrixOperations<DataType>::dense_matvec_plus(

             this->cublas_handle[device_id],

             this->device_A[device_id],

             device_vector,

             alpha,

             this->num_rows,

             this->num_columns,

             this->A_is_row_major,

             device_product);

 }


 // =============

 // transpose dot

 // =============


 template <typename DataType>

 void cuDenseMatrix<DataType>::transpose_dot(

         const DataType* device_vector,

         DataType* device_product)

 {

     assert(this->copied_host_to_device);


     // Get device id

     int device_id = CudaInterface<DataType>::get_device();


     cuMatrixOperations<DataType>::dense_transposed_matvec(

             this->cublas_handle[device_id],

             this->device_A[device_id],

             device_vector,

             this->num_rows,

             this->num_columns,

             this->A_is_row_major,

             device_product);

 }


 // ==================

 // transpose dot plus

 // ==================


 template <typename DataType>

 void cuDenseMatrix<DataType>::transpose_dot_plus(

         const DataType* device_vector,

         const DataType alpha,

         DataType* device_product)

 {

     assert(this->copied_host_to_device);


     // Get device id

     int device_id = CudaInterface<DataType>::get_device();


     cuMatrixOperations<DataType>::dense_transposed_matvec_plus(

             this->cublas_handle[device_id],

             this->device_A[device_id],

             device_vector,

             alpha,

             this->num_rows,

             this->num_columns,

             this->A_is_row_major,

             device_product);

 }


 // ===============================

 // Explicit template instantiation

 // ===============================


 template class cuDenseMatrix<float>;

 template class cuDenseMatrix<double>;

CudaInterface::get_device
static int get_device()
Gets the current device in multi-gpu applications.
Definition: cuda_interface.cu:206

CudaInterface::del
static void del(void *device_array)
Deletes memory on gpu device if its pointer is not NULL, then sets the pointer to NULL.
Definition: cuda_interface.cu:166

CudaInterface::alloc
static ArrayType * alloc(const LongIndexType array_size)
Allocates memory on gpu device. This function creates a pointer and returns it.
Definition: cuda_interface.cu:36

CudaInterface::copy_to_device
static void copy_to_device(const ArrayType *host_array, const LongIndexType array_size, ArrayType *device_array)
Copies memory on host to device memory.
Definition: cuda_interface.cu:142

CudaInterface::set_device
static void set_device(int device_id)
Sets the current device in multi-gpu applications.
Definition: cuda_interface.cu:188

cDenseMatrix
Definition: c_dense_matrix.h:30

cLinearOperator
Base class for linear operators. This class serves as interface for all derived classes.
Definition: c_linear_operator.h:41

cuDenseMatrix
Definition: cu_dense_matrix.h:33

cuDenseMatrix::transpose_dot_plus
virtual void transpose_dot_plus(const DataType *device_vector, const DataType alpha, DataType *device_product)
Definition: cu_dense_matrix.cu:208

cuDenseMatrix::transpose_dot
virtual void transpose_dot(const DataType *device_vector, DataType *device_product)
Definition: cu_dense_matrix.cu:183

cuDenseMatrix::dot_plus
virtual void dot_plus(const DataType *device_vector, const DataType alpha, DataType *device_product)
Definition: cu_dense_matrix.cu:156

cuDenseMatrix::cuDenseMatrix
cuDenseMatrix()
Definition: cu_dense_matrix.cu:29

cuDenseMatrix::copy_host_to_device
virtual void copy_host_to_device()
Copies the member data from the host memory to the device memory.
Definition: cu_dense_matrix.cu:95

cuDenseMatrix::~cuDenseMatrix
virtual ~cuDenseMatrix()
Definition: cu_dense_matrix.cu:66

cuDenseMatrix::dot
virtual void dot(const DataType *device_vector, DataType *device_product)
Definition: cu_dense_matrix.cu:131

cuLinearOperator::initialize_cublas_handle
void initialize_cublas_handle()
Creates a cublasHandle_t object, if not created already.
Definition: cu_linear_operator.cu:185

cuMatrixOperations::dense_matvec
static void dense_matvec(cublasHandle_t cublas_handle, const DataType *A, const DataType *b, const LongIndexType num_rows, const LongIndexType num_columns, const FlagType A_is_row_major, DataType *c)
Computes the matrix vector multiplication  where  is a dense matrix.
Definition: cu_matrix_operations.cu:52

cuMatrixOperations::dense_transposed_matvec_plus
static void dense_transposed_matvec_plus(cublasHandle_t cublas_handle, const DataType *A, const DataType *b, const DataType alpha, const LongIndexType num_rows, const LongIndexType num_columns, const FlagType A_is_row_major, DataType *c)
Computes  where  is dense, and  is the transpose of the matrix .
Definition: cu_matrix_operations.cu:280

cuMatrixOperations::dense_transposed_matvec
static void dense_transposed_matvec(cublasHandle_t cublas_handle, const DataType *A, const DataType *b, const LongIndexType num_rows, const LongIndexType num_columns, const FlagType A_is_row_major, DataType *c)
Computes matrix vector multiplication  where  is dense, and  is the transpose of the matrix .
Definition: cu_matrix_operations.cu:203

cuMatrixOperations::dense_matvec_plus
static void dense_matvec_plus(cublasHandle_t cublas_handle, const DataType *A, const DataType *b, const DataType alpha, const LongIndexType num_rows, const LongIndexType num_columns, const FlagType A_is_row_major, DataType *c)
Computes the operation  where  is a dense matrix.
Definition: cu_matrix_operations.cu:128

cuMatrix
Base class for constant matrices.
Definition: cu_matrix.h:41

cu_dense_matrix.h

LongIndexType
int LongIndexType
Definition: types.h:60

FlagType
int FlagType
Definition: types.h:68