GridTools · petiaccja · Aug 17, 2022 · Aug 12, 2022 · Aug 15, 2022 · Aug 15, 2022
diff --git a/include/gridtools/common/cuda_util.hpp b/include/gridtools/common/cuda_util.hpp
@@ -9,6 +9,7 @@
  */
 #pragma once
 
+#include <cassert>
 #include <memory>
 #include <sstream>
 #include <stdexcept>

diff --git a/include/gridtools/fn/backend/gpu.hpp b/include/gridtools/fn/backend/gpu.hpp
@@ -139,29 +139,37 @@ namespace gridtools::fn::backend {
             }
         };
 
+        template <class Sizes>
+        bool is_domain_empty(const Sizes &sizes) {
+            return tuple_util::host::apply([](auto... sizes) { return ((sizes == 0) || ...); }, sizes);
+        }
+
         template <class BlockSizes, class Sizes, class StencilStage, class MakeIterator, class Composite>
         void apply_stencil_stage(gpu<BlockSizes> const &g,
             Sizes const &sizes,
             StencilStage,
             MakeIterator make_iterator,
             Composite &&composite) {
-            auto ptr_holder = sid::get_origin(std::forward<Composite>(composite));
-            auto strides = sid::get_strides(std::forward<Composite>(composite));
-
-            auto [blocks, threads] = blocks_and_threads<BlockSizes>(sizes);
-            cuda_util::launch(blocks,
-                threads,
-                0,
-                g.stream,
-                kernel<BlockSizes,
-                    Sizes,
-                    decltype(ptr_holder),
-                    decltype(strides),
-                    stencil_fun_f<StencilStage, MakeIterator>>,
-                sizes,
-                ptr_holder,
-                strides,
-                stencil_fun_f<StencilStage, MakeIterator>{std::move(make_iterator)});
+            if (!is_domain_empty(sizes)) {
+                auto ptr_holder = sid::get_origin(std::forward<Composite>(composite));
+                auto strides = sid::get_strides(std::forward<Composite>(composite));
+
-
+
+if empty_domain(sizes)
+    return;
+
-
+
+if empty_domain(sizes)
+    return;
+
+                auto [blocks, threads] = blocks_and_threads<BlockSizes>(sizes);
+                assert(threads.x > 0 && threads.y > 0 && threads.z > 0);
+                cuda_util::launch(blocks,
+                    threads,
+                    0,
+                    g.stream,
+                    kernel<BlockSizes,
+                        Sizes,
+                        decltype(ptr_holder),
+                        decltype(strides),
+                        stencil_fun_f<StencilStage, MakeIterator>>,
+                    sizes,
+                    ptr_holder,
+                    strides,
+                    stencil_fun_f<StencilStage, MakeIterator>{std::move(make_iterator)});
+            }
         }
 
         template <class ColumnStage, class MakeIterator, class Seed>
@@ -190,25 +198,28 @@ namespace gridtools::fn::backend {
             Composite &&composite,
             Vertical,
             Seed seed) {
-            auto ptr_holder = sid::get_origin(std::forward<Composite>(composite));
-            auto strides = sid::get_strides(std::forward<Composite>(composite));
-            auto h_sizes = hymap::canonicalize_and_remove_key<Vertical>(sizes);
-            int v_size = at_key<Vertical>(sizes);
-
-            auto [blocks, threads] = blocks_and_threads<BlockSizes>(h_sizes);
-            cuda_util::launch(blocks,
-                threads,
-                0,
-                g.stream,
-                kernel<BlockSizes,
-                    decltype(h_sizes),
-                    decltype(ptr_holder),
-                    decltype(strides),
-                    column_fun_f<ColumnStage, MakeIterator, Seed>>,
-                h_sizes,
-                ptr_holder,
-                strides,
-                column_fun_f<ColumnStage, MakeIterator, Seed>{std::move(make_iterator), std::move(seed), v_size});
+            if (!is_domain_empty(sizes)) {
+                auto ptr_holder = sid::get_origin(std::forward<Composite>(composite));
+                auto strides = sid::get_strides(std::forward<Composite>(composite));
+                auto h_sizes = hymap::canonicalize_and_remove_key<Vertical>(sizes);
+                int v_size = at_key<Vertical>(sizes);
+
+                auto [blocks, threads] = blocks_and_threads<BlockSizes>(h_sizes);
+                assert(threads.x > 0 && threads.y > 0 && threads.z > 0);
+                cuda_util::launch(blocks,
+                    threads,
+                    0,
+                    g.stream,
+                    kernel<BlockSizes,
+                        decltype(h_sizes),
+                        decltype(ptr_holder),
+                        decltype(strides),
+                        column_fun_f<ColumnStage, MakeIterator, Seed>>,
+                    h_sizes,
+                    ptr_holder,
+                    strides,
+                    column_fun_f<ColumnStage, MakeIterator, Seed>{std::move(make_iterator), std::move(seed), v_size});
+            }
         }
 
         template <class BlockSizes>

diff --git a/tests/unit_tests/fn/test_fn_backend_gpu.cu b/tests/unit_tests/fn/test_fn_backend_gpu.cu
@@ -12,6 +12,7 @@
 #include <gtest/gtest.h>
 
 #include <gridtools/fn/column_stage.hpp>
+#include <gridtools/fn/unstructured.hpp>
 #include <gridtools/sid/composite.hpp>
 #include <gridtools/sid/synthetic.hpp>
 
@@ -207,5 +208,64 @@ namespace gridtools::fn::backend {
             bool success = on_device::exec(global_tmp_check_fun(), ptr_holder, strides);
             EXPECT_TRUE(success);
         }
+
+        struct empty_stencil {
+            GT_FUNCTION constexpr auto operator()() const {
+                return []() { return 0.0f; };
+            }
+        };
+
+        TEST(backend_gpu, empty_domain_stencil) {
+            constexpr size_t nvertices = 0;
+            constexpr size_t nlevels = 0;
+
+            using block_sizes_t = meta::list<meta::list<unstructured::dim::horizontal, int_t<32>>,
+                meta::list<unstructured::dim::vertical, int_t<1>>>;
+
+            auto out = cuda_util::cuda_malloc<int>(nvertices * nlevels);
+            auto as_synthetic = [](int *x) {
+                return sid::synthetic()
+                    .set<property::origin>(sid::host_device::simple_ptr_holder(x))
+                    .set<property::strides>(
+                        hymap::keys<unstructured::dim::horizontal, unstructured::dim::vertical>::make_values(5_c, 1_c));
+            };
+            auto out_s = as_synthetic(out.get());
+
+            auto domain = unstructured_domain(tuple{nvertices, nlevels}, tuple{0, 0});
+            auto backend = make_backend(backend::gpu<block_sizes_t>(), domain);
+            backend.stencil_executor()().arg(out_s).assign(0_c, empty_stencil{}).execute();
+        }
+
+        struct empty_column : fwd {
+            static GT_FUNCTION constexpr auto prologue() {
+                return tuple(scan_pass([](auto acc) { return acc; }, host_device::identity()));
+            }
+
+            static GT_FUNCTION constexpr auto body() {
+                return scan_pass([](auto acc) { return acc; }, host_device::identity());
+            }
+        };
+
+        TEST(backend_gpu, empty_domain_column) {
+            constexpr size_t nvertices = 0;
+            constexpr size_t nlevels = 0;
+
+            using block_sizes_t = meta::list<meta::list<unstructured::dim::horizontal, int_t<32>>,
+                meta::list<unstructured::dim::vertical, int_t<1>>>;
+
+            auto out = cuda_util::cuda_malloc<int>(nvertices * nlevels);
+            auto as_synthetic = [](int *x) {
+                return sid::synthetic()
+                    .set<property::origin>(sid::host_device::simple_ptr_holder(x))
+                    .set<property::strides>(
+                        hymap::keys<unstructured::dim::horizontal, unstructured::dim::vertical>::make_values(5_c, 1_c));
+            };
+            auto out_s = as_synthetic(out.get());
+
+            auto domain = unstructured_domain(tuple{nvertices, nlevels}, tuple{0, 0});
+            auto backend = make_backend(backend::gpu<block_sizes_t>(), domain);
+            backend.vertical_executor()().arg(out_s).assign(0_c, empty_column{}, 0.0f).execute();
+        }
+
     } // namespace
 } // namespace gridtools::fn::backend