Migrate output layer

2025-12-22 22:34:22 +00:00 · 2024-09-10 19:20:00 +02:00
parent f7b525e494
commit 74f49d6a00
6 changed files with 34 additions and 12 deletions
--- a/src/backends/cuda/layers/output.cu
+++ b/src/backends/cuda/layers/output.cu
@@ -0,0 +1,14 @@
+#include "output.hpp"
+
+#include "cuda_helper.cuh"
+
+using namespace CUDANet::Layers;
+
+float* Output::forwardCUDA(const float* input) {
+    CUDA_CHECK(cudaMemcpy(
+        h_output, input, sizeof(float) * inputSize, cudaMemcpyDeviceToHost
+    ));
+    CUDA_CHECK(cudaDeviceSynchronize());
+
+    return h_output;
+}
--- a/src/layers/output.cu
+++ b/src/layers/output.cu
@@ -1,6 +1,5 @@
-#include "output.cuh"
-
-#include "cuda_helper.cuh"
+#include "output.hpp"
+#include <stdexcept>

 using namespace CUDANet::Layers;

@@ -13,13 +12,16 @@ Output::~Output() {
    free(h_output);
 }

-float* Output::forward(const float* input) {
-    CUDA_CHECK(cudaMemcpy(
-        h_output, input, sizeof(float) * inputSize, cudaMemcpyDeviceToHost
-    ));
-    CUDA_CHECK(cudaDeviceSynchronize());
+float* Output::forwardCPU(const float* input) {
+    throw std::logic_error("Not implemented");
+}

-    return h_output;
+float* Output::forward(const float* input) {
+#ifdef USE_CUDA
+    return forwardCUDA(input);
+#else
+    return forwardCPU(input);
+#endif
 }

 int Output::getOutputSize() {