Migrate output layer

2025-12-22 14:24:22 +00:00 · 2024-09-10 19:20:00 +02:00
parent f7b525e494
commit 74f49d6a00
6 changed files with 34 additions and 12 deletions
--- a/include/cudanet.cuh
+++ b/include/cudanet.cuh
@@ -19,7 +19,7 @@
 #include "input.hpp"
 #include "layer.hpp"
 #include "max_pooling.hpp"
-#include "output.cuh"
+#include "output.hpp"

 // Models
 #include "model.hpp"
--- a/include/layers/output.hpp
+++ b/include/layers/output.hpp
@@ -46,6 +46,12 @@ class Output : public SequentialLayer {
  private:
    int    inputSize;
    float* h_output;
+
+    float* forwardCPU(const float* input);
+
+#ifdef USE_CUDA
+    float* forwardCUDA(const float* input);
+#endif
 };

 }  // namespace CUDANet::Layers
--- a/include/model/model.hpp
+++ b/include/model/model.hpp
@@ -8,7 +8,7 @@
 #include "input.hpp"
 #include "layer.hpp"
 #include "module.hpp"
-#include "output.cuh"
+#include "output.hpp"

 namespace CUDANet {

--- a/src/backends/cuda/layers/output.cu
+++ b/src/backends/cuda/layers/output.cu
@@ -0,0 +1,14 @@
+#include "output.hpp"
+
+#include "cuda_helper.cuh"
+
+using namespace CUDANet::Layers;
+
+float* Output::forwardCUDA(const float* input) {
+    CUDA_CHECK(cudaMemcpy(
+        h_output, input, sizeof(float) * inputSize, cudaMemcpyDeviceToHost
+    ));
+    CUDA_CHECK(cudaDeviceSynchronize());
+
+    return h_output;
+}
--- a/src/layers/output.cu
+++ b/src/layers/output.cu
@@ -1,6 +1,5 @@
-#include "output.cuh"
-
-#include "cuda_helper.cuh"
+#include "output.hpp"
+#include <stdexcept>

 using namespace CUDANet::Layers;

@@ -13,13 +12,16 @@ Output::~Output() {
    free(h_output);
 }

-float* Output::forward(const float* input) {
-    CUDA_CHECK(cudaMemcpy(
-        h_output, input, sizeof(float) * inputSize, cudaMemcpyDeviceToHost
-    ));
-    CUDA_CHECK(cudaDeviceSynchronize());
+float* Output::forwardCPU(const float* input) {
+    throw std::logic_error("Not implemented");
+}

-    return h_output;
+float* Output::forward(const float* input) {
+#ifdef USE_CUDA
+    return forwardCUDA(input);
+#else
+    return forwardCPU(input);
+#endif
 }

 int Output::getOutputSize() {
--- a/test/cuda/layers/test_output.cu
+++ b/test/cuda/layers/test_output.cu
@@ -1,7 +1,7 @@
 #include <cuda_runtime_api.h>
 #include <gtest/gtest.h>

-#include "output.cuh"
+#include "output.hpp"

 TEST(OutputLayerTest, OutputForward) {
    cudaError_t cudaStatus;