Initialize conv2d layer

2025-12-22 14:24:22 +00:00 · 2024-03-04 22:16:03 +01:00
parent f37320594a
commit cfc5c46d5e
5 changed files with 148 additions and 32 deletions
--- a/CMakeLists.txt
+++ b/CMakeLists.txt
@@ -13,6 +13,7 @@ set(LIBRARY_SOURCES
    src/kernels/activations.cu
    src/kernels/padding.cu
    src/layers/dense.cu
+    src/layers/conv2d.cu
 )

 set(CMAKE_CUDA_ARCHITECTURES 75)
--- a/include/layers/conv.cuh
+++ b/include/layers/conv.cuh
@@ -1,31 +0,0 @@
-#ifndef CONV_LAYER_H
-#define CONV_LAYER_H
-
-#include <cublas_v2.h>
-
-namespace Layers {
-
-class Conv {
-  public:
-    Conv(
-        int            inputSize,
-        int            outputSize,
-        int            kernelSize,
-        cublasHandle_t cublasHandle
-    );
-    ~Conv();
-
-    void forward(const float* input, float* output);
-
-  private:
-    int            inputSize;
-    int            outputSize;
-    int            kernelSize;
-    cublasHandle_t cublasHandle;
-    float*         d_weights;
-    float*         d_biases;
-};
-
-}  // namespace Layers
-
-#endif  // CONV_LAYER_H
--- a/include/layers/conv2d.cuh
+++ b/include/layers/conv2d.cuh
@@ -0,0 +1,60 @@
+#ifndef CONV_LAYER_H
+#define CONV_LAYER_H
+
+#include <cublas_v2.h>
+
+#include <string>
+#include <vector>
+
+#include "activations.cuh"
+
+namespace Layers {
+
+class Conv2d {
+  public:
+    Conv2d(
+        int            inputSize,
+        int            inputChannels,
+        int            kernelSize,
+        int            stride,
+        std::string    padding,
+        int            numFilters,
+        Activation     activation,
+        cublasHandle_t cublasHandle
+    );
+    ~Conv2d();
+
+    void forward(const float* d_input, float* d_output);
+
+  private:
+    // Inputs
+    int inputSize;
+    int inputChannels;
+
+    // Kernel
+    int kernelSize;
+    int stride;
+    int paddingSize;
+    int numFilters;
+
+    // Outputs
+    int outputSize;
+
+    // Kernels
+    std::vector<float> kernels;
+
+    // Cuda
+    cublasHandle_t cublasHandle;
+    float*         d_kernels;
+    float*         d_padded;
+
+    // Kernels
+    Activation activation;
+
+    void initializeKernels();
+    void toCuda();
+};
+
+}  // namespace Layers
+
+#endif  // CONV_LAYER_H
--- a/include/layers/dense.cuh
+++ b/include/layers/dense.cuh
@@ -21,7 +21,7 @@ class Dense : public ILayer {
    );
    ~Dense();

-    void forward(const float* input, float* output);
+    void forward(const float* d_input, float* d_output);
    void setWeights(const std::vector<std::vector<float>>& weights);
    void setBiases(const std::vector<float>& biases);

--- a/src/layers/conv2d.cu
+++ b/src/layers/conv2d.cu
@@ -0,0 +1,86 @@
+#include <cublas_v2.h>
+
+#include <string>
+
+#include "activations.cuh"
+#include "conv2d.cuh"
+#include "cuda_helper.cuh"
+#include "padding.cuh"
+
+Layers::Conv2d::Conv2d(
+    int            inputSize,
+    int            inputChannels,
+    int            kernelSize,
+    int            stride,
+    std::string    padding,
+    int            numFilters,
+    Activation     activation,
+    cublasHandle_t cublasHandle
+)
+    : inputSize(inputSize),
+      inputChannels(inputChannels),
+      kernelSize(kernelSize),
+      stride(stride),
+      numFilters(numFilters),
+      cublasHandle(cublasHandle),
+      activation(activation) {
+    // Allocate memory for kernels
+
+    if (padding == "SAME") {
+        outputSize  = inputSize;
+        paddingSize = ((stride - 1) * inputSize - stride + kernelSize) / 2;
+    } else if (padding == "VALID") {
+        paddingSize = 0;
+        outputSize  = (inputSize - kernelSize) / stride + 1;
+    }
+
+    kernels.resize(kernelSize * kernelSize);
+    initializeKernels();
+
+    d_kernels = nullptr;
+
+    CUDA_CHECK(
+        cudaMalloc((void**)&d_kernels, sizeof(float) * kernelSize * kernelSize)
+    );
+    toCuda();
+
+    d_padded = nullptr;
+
+    if (paddingSize > 0) {
+        CUDA_CHECK(
+            cudaMalloc((void**)&d_padded,
+                       sizeof(float) * (inputSize + 2 * paddingSize) *
+                           (inputSize + 2 * paddingSize) * inputChannels)
+        );
+    }
+}
+
+Layers::Conv2d::~Conv2d() {
+    cudaFree(d_kernels);
+    cudaFree(d_padded);
+}
+
+void Layers::Conv2d::initializeKernels() {
+    std::fill(kernels.begin(), kernels.end(), 0.0f);
+}
+
+void Layers::Conv2d::toCuda() {
+    CUDA_CHECK(cudaMemcpy(
+        d_kernels, kernels.data(), sizeof(float) * kernelSize * kernelSize,
+        cudaMemcpyHostToDevice
+    ));
+}
+
+void Layers::Conv2d::forward(const float* d_input, float* d_output) {
+
+    // Padd input
+    int THREADS_PER_BLOCK = 256;
+    int BLOCKS            = (outputSize * outputSize * inputChannels) / THREADS_PER_BLOCK + 1;
+
+    pad_matrix_kernel<<<BLOCKS, THREADS_PER_BLOCK>>>(
+        d_input, d_padded, inputSize, inputSize, inputChannels, paddingSize
+    );
+
+    // TODO: Implement 2D convolution
+
+}