cms-patatrack · fwyzard · Jun 4, 2018 · May 30, 2018 · Jun 4, 2018 · Jun 4, 2018
diff --git a/RecoLocalTracker/SiPixelClusterizer/plugins/gpuClustering.h b/RecoLocalTracker/SiPixelClusterizer/plugins/gpuClustering.h
@@ -1,9 +1,9 @@
 #ifndef RecoLocalTracker_SiPixelClusterizer_plugins_gpuClustering_h
 #define RecoLocalTracker_SiPixelClusterizer_plugins_gpuClustering_h
 
-#include <cassert>
 #include <cstdint>
 #include <cstdio>
+#include<cassert>
 
 namespace gpuClustering {
 
@@ -46,6 +46,8 @@ namespace gpuClustering {
 
     __shared__  int msize;    
 
+    if (blockIdx.x >=moduleStart[0]) return;
+
     auto first = moduleStart[1 + blockIdx.x];  
 
     auto me = id[first];
@@ -79,9 +81,11 @@ namespace gpuClustering {
     if (first>=msize) return;
 
     int jmax[10];
+    // int jmin[10];
     auto niter = (msize-first)/blockDim.x;
     assert(niter<10);
-    for (int i=0; i<niter+1; ++i) jmax[i]=msize;    
+    // for (int k=0; k<niter+1; ++k) jmin[k]=first+k*blockDim.x+1;    
+    for (int k=0; k<niter+1; ++k) jmax[k]=msize;
 
     while (go) {
       __syncthreads();
@@ -94,11 +98,16 @@ namespace gpuClustering {
 	if (id[i]==InvId) continue;  // not valid
 	assert(id[i]==me); //  break;  // end of module
 	++debug[i];
+        auto js = i+1;
+//        auto js = jmin[k]; 
         auto jm = jmax[k];
-	for (int j=i+1; j<jm; ++j) {
+        jmax[k]=i+1;
+//        bool first = true;
+	for (int j=js; j<jm; ++j) {
  	  if (id[j]==InvId) continue;  // not valid
-          if (std::abs(int(x[j])-int(x[i]))>1) continue;
-	  if (std::abs(int(y[j])-int(y[i]))>1) continue;
+          if (std::abs(int(x[j])-int(x[i]))>1 |
+	      std::abs(int(y[j])-int(y[i]))>1) continue;
+//          if (first) {jmin[k] = j; first=false;}
 	  auto old = atomicMin(&clus[j],clus[i]);
 	  if (old!=clus[i]) go=true;
 	  atomicMin(&clus[i],old);
@@ -167,4 +176,4 @@ namespace gpuClustering {
 
 } //namespace gpuClustering
 
-#endif // RecoLocalTracker_SiPixelClusterizer_plugins_gpuClustering_h
+#endif
diff --git a/RecoLocalTracker/SiPixelClusterizer/test/gpuClustering.cu b/RecoLocalTracker/SiPixelClusterizer/test/gpuClustering.cu
@@ -198,13 +198,8 @@ int main(void)
 	       d_id.get(), d_moduleStart.get() ,d_clus.get(),n
 	       );
 
-  cuda::memory::copy(&nModules,d_moduleStart.get(),sizeof(uint32_t));
-
-  std::cout << "found " << nModules << " Modules active" << std::endl;
-
-
   threadsPerBlock = 256;
-  blocksPerGrid = nModules;
+  blocksPerGrid = MaxNumModules;    //nModules;
 
 
 
@@ -226,6 +221,10 @@ int main(void)
 	       );
 
 
+  cuda::memory::copy(&nModules,d_moduleStart.get(),sizeof(uint32_t));
+  std::cout << "found " << nModules << " Modules active" << std::endl;
+
+
   uint32_t nclus[MaxNumModules], moduleId[nModules];  
   cuda::memory::copy(h_clus.get(), d_clus.get(), size32);
   cuda::memory::copy(&nclus,d_clusInModule.get(),MaxNumModules*sizeof(uint32_t));