Fix small layer issues

2025-12-22 14:24:22 +00:00 · 2025-11-22 00:33:51 +01:00
parent 4c8b2ef537
commit 104d6ea33d
6 changed files with 12 additions and 4 deletions
--- a/src/backends/cuda/layer_ops.cu
+++ b/src/backends/cuda/layer_ops.cu
@@ -98,7 +98,7 @@ CUDANet::Tensor& CUDA::conv2d(
    dim3 grid(
        (out_shape[0] + block.x - 1) / block.x,
        (out_shape[1] + block.y - 1) / block.y,
-        (out_shape[3] + block.z - 1) / block.z
+        (out_shape[2] + block.z - 1) / block.z
    );

    Kernels::convolution<<<grid, block>>>(
@@ -212,6 +212,7 @@ CUDANet::Tensor& CUDA::batch_norm(
        CUDA_CHECK(cudaGetLastError());
    }
    CUDA_CHECK(cudaDeviceSynchronize());
+    return output;
 }

 CUDANet::Tensor& CUDA::concat(
--- a/src/layers/add.cpp
+++ b/src/layers/add.cpp
@@ -19,4 +19,10 @@ Add::~Add() {}
 CUDANet::Tensor&
 Add::forward(CUDANet::Tensor& input_a, CUDANet::Tensor& input_b) {
    output.zero();
+    backend->add(
+        input_a,
+        input_b,
+        output
+    );
+    return output;
 }
--- a/src/layers/avg_pooling.cpp
+++ b/src/layers/avg_pooling.cpp
@@ -76,7 +76,7 @@ size_t AvgPool2d::input_size() {
 }

 size_t AvgPool2d::output_size() {
-    return sizeof(float) * out_shape[0] * out_shape[1] * out_shape[3];
+    return sizeof(float) * out_shape[0] * out_shape[1] * out_shape[2];
 }

 void AvgPool2d::set_weights(void* input) {}
--- a/src/layers/conv2d.cpp
+++ b/src/layers/conv2d.cpp
@@ -47,7 +47,7 @@ Conv2d::Conv2d(
    };

    output = CUDANet::Tensor(
-        Shape{out_shape[0], out_shape[1], out_shape[3]},
+        Shape{out_shape[0], out_shape[1], out_shape[2]},
        CUDANet::DType::FLOAT32, backend
    );

--- a/src/layers/dense.cpp
+++ b/src/layers/dense.cpp
@@ -30,6 +30,7 @@ Dense::Dense(CUDANet::Shape in_shape, CUDANet::Shape out_shape, CUDANet::Backend
 Dense::~Dense() {}

 CUDANet::Tensor& Dense::forward(CUDANet::Tensor& input) {
+    output.zero();
    backend->dense(weights, biases, input, output, in_shape[0], out_shape[0]);
    return output;
 }
--- a/src/layers/max_pool.cpp
+++ b/src/layers/max_pool.cpp
@@ -41,7 +41,7 @@ MaxPool2d::MaxPool2d(
    };

    output = CUDANet::Tensor(
-        Shape{out_shape[0] * out_shape[1] * out_shape[3]},
+        Shape{out_shape[0] * out_shape[1] * out_shape[2]},
        CUDANet::DType::FLOAT32, backend
    );
 }