Initial CUDA test

2025-11-06 01:34:22 +00:00 · 2024-02-07 21:14:46 +01:00
parent 009116ddb5
commit b16ec69469
5 changed files with 161 additions and 0 deletions
--- a/src/main.cpp
+++ b/src/main.cpp
@@ -0,0 +1,68 @@
+#include <stdio.h>
+#include <stdlib.h>
+#include <cuda_runtime.h>
+#include "cublas_v2.h"
+#include "cuda_helper.h"
+
+int main() {
+    // Initialize CUDA and get device properties
+    cudaDeviceProp deviceProp = initializeCUDA();
+
+    // Specify vector size
+    const int N = 5;
+
+    // Host vectors
+    float *h_A, *h_B, *h_C;
+
+    // Allocate host memory
+    h_A = (float*)malloc(N * sizeof(float));
+    h_B = (float*)malloc(N * sizeof(float));
+    h_C = (float*)malloc(N * sizeof(float));
+
+    // Initialize host vectors
+    for (int i = 0; i < N; ++i) {
+        h_A[i] = static_cast<float>(i);
+        h_B[i] = static_cast<float>(2 * i);
+    }
+
+    // Allocate device memory
+    float *d_A, *d_B, *d_C;
+    cudaMalloc((void**)&d_A, N * sizeof(float));
+    cudaMalloc((void**)&d_B, N * sizeof(float));
+    cudaMalloc((void**)&d_C, N * sizeof(float));
+
+    // Copy host vectors to device
+    cudaMemcpy(d_A, h_A, N * sizeof(float), cudaMemcpyHostToDevice);
+    cudaMemcpy(d_B, h_B, N * sizeof(float), cudaMemcpyHostToDevice);
+
+    // Create cuBLAS handle
+    cublasHandle_t handle;
+    cublasCreate(&handle);
+
+    // Perform vector addition: C = A + B
+    const float alpha = 1.0f;
+    const float beta = 1.0f;
+    cublasSaxpy(handle, N, &alpha, d_A, 1, d_B, 1);
+    cublasSaxpy(handle, N, &beta, d_B, 1, d_C, 1);
+
+    // Copy result from device to host
+    cudaMemcpy(h_C, d_C, N * sizeof(float), cudaMemcpyDeviceToHost);
+
+    // Display result
+    printf("Result: ");
+    for (int i = 0; i < N; ++i) {
+        printf("%f ", h_C[i]);
+    }
+    printf("\n");
+
+    // Clean up
+    free(h_A);
+    free(h_B);
+    free(h_C);
+    cudaFree(d_A);
+    cudaFree(d_B);
+    cudaFree(d_C);
+    cublasDestroy(handle);
+
+    return 0;
+}
--- a/src/utils/cuda_helper.cpp
+++ b/src/utils/cuda_helper.cpp
@@ -0,0 +1,36 @@
+#include <cstdio>
+#include <cstdlib>
+#include "cuda_helper.h"
+
+// CUDA error checking macro
+#define CUDA_CHECK(call) \
+do { \
+    cudaError_t result = call; \
+    if (result != cudaSuccess) { \
+        std::fprintf(stderr, "CUDA error at %s:%d code=%d(%s) \"%s\" \n", \
+                     __FILE__, __LINE__, static_cast<unsigned int>(result), \
+                     cudaGetErrorString(result), #call); \
+        std::exit(EXIT_FAILURE); \
+    } \
+} while (0)
+
+// Initialize CUDA and return the device properties
+cudaDeviceProp initializeCUDA() {
+    int deviceCount;
+    CUDA_CHECK(cudaGetDeviceCount(&deviceCount));
+
+    if (deviceCount == 0) {
+        std::fprintf(stderr, "No CUDA devices found. Exiting.\n");
+        std::exit(EXIT_FAILURE);
+    }
+
+    int device = 0; // You can modify this to choose a different GPU
+    CUDA_CHECK(cudaSetDevice(device));
+
+    cudaDeviceProp deviceProp;
+    CUDA_CHECK(cudaGetDeviceProperties(&deviceProp, device));
+
+    std::printf("Using CUDA device %d: %s\n", device, deviceProp.name);
+
+    return deviceProp;
+}