[AWIBOF-5236] Reserve vector memory before latency logging

isaac-baek · isaac-baek · commit d08b74f031c9 · 2022-02-08T13:41:44.000+09:00
- Adjust dynamic rebalancing to latency token for memory optimization
- Reserve enough vector memory before latency logging so that memory allocation(in vector push_back) will not occur during logging

Signed-off-by: isaac.baek &lt;isaac.baek@samsung.com&gt;
diff --git a/src/collection/SwitchGear.cpp b/src/collection/SwitchGear.cpp
@@ -68,7 +68,7 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)
         lat_data->start_deadline--;
         if (0 >= lat_data->start_deadline)
         {
-            lat_data->start_token = lib::LAT_TOKEN_SIZE;
+            lat_data->start_token = lat_data->start_token_size;
             lat_data->start_state = lib::TimeLogState::RUN;
         }
     }
@@ -78,7 +78,6 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)
         if (-9 > lat_data->start_deadline)
         {
             lat_data->start_state = lib::TimeLogState::STOP;
-            lat_data->access = false;
         }
     }
 
@@ -87,7 +86,7 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)
         lat_data->end_deadline--;
         if (0 >= lat_data->end_deadline)
         {
-            lat_data->end_token = lib::LAT_TOKEN_SIZE;
+            lat_data->end_token = lat_data->end_token_size;
             lat_data->end_state = lib::TimeLogState::RUN;
         }
     }
@@ -97,7 +96,6 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)
         if (-9 > lat_data->end_deadline)
         {
             lat_data->end_state = lib::TimeLogState::STOP;
-            lat_data->access = false;
         }
     }
 }
diff --git a/src/lib/Data.h b/src/lib/Data.h
@@ -37,7 +37,6 @@ namespace lib
 const uint32_t IDLE_THRESHOLD {5};
 const uint32_t MAX_PACKET_CNT_SIZE {10};
 const uint32_t TIMELAG_SIZE {100};
-const int32_t LAT_TOKEN_SIZE {1000};
 
 struct Data
 {
@@ -91,11 +90,13 @@ struct LatencyData : public Data
     std::vector<struct TimeLog> start_v;
     TimeLogState start_state {TimeLogState::IDLE};
     int32_t start_token {0};
+    int32_t start_token_size {static_cast<int32_t>(TIMELAG_SIZE)};
     int32_t start_deadline {-45};
 
     std::vector<struct TimeLog> end_v;
     TimeLogState end_state {TimeLogState::IDLE};
     int32_t end_token {0};
+    int32_t end_token_size {static_cast<int32_t>(TIMELAG_SIZE)};
     int32_t end_deadline {-45};
 };
 
diff --git a/src/process/TimingDistributor.cpp b/src/process/TimingDistributor.cpp
@@ -40,7 +40,7 @@ process::TimingDistributor::SetTiming(
             uint32_t index_size = node_meta_getter->IndexSize(nid);
             uint32_t filter_size = node_meta_getter->FilterSize(nid);
 
-            if (node_meta_getter->ProcessorType(nid) == air::ProcessorType::LATENCY)
+            if (air::ProcessorType::LATENCY == node_meta_getter->ProcessorType(nid))
             {
                 for (uint32_t hash_index = 0; hash_index < index_size; hash_index++)
                 {
@@ -53,6 +53,8 @@ process::TimingDistributor::SetTiming(
                         lib::LatencyData* from = static_cast<lib::LatencyData*>(
                             kv.second->node[nid]->GetUserDataByHashIndex(
                                 hash_index, filter_index));
+                        lib::AccLatencyData* acc = node_manager->GetAccLatData(
+                            nid, hash_index, filter_index);
 
                         uint64_t key {0};
                         int32_t value {0};
@@ -66,23 +68,72 @@ process::TimingDistributor::SetTiming(
                             timing_map.insert({key, value});
                         }
 
-                        _ResetTiming(from, to, timing_map[key]);
+                        _ResetTiming(from, to, timing_map[key], acc->sample_count);
                     }
                 }
             }
         }
     }
+
+    for (uint32_t nid = 0; nid < MAX_NID_SIZE; nid++)
+    {
+        if (node_meta_getter->ProcessorType(nid) == air::ProcessorType::LATENCY)
+        {
+            uint32_t index_size = node_meta_getter->IndexSize(nid);
+            for (uint32_t hash_index = 0; hash_index < index_size; hash_index++)
+            {
+                uint32_t filter_size = node_meta_getter->FilterSize(nid);
+                for (uint32_t filter_index = 0; filter_index < filter_size - 1;
+                     filter_index++)
+                {
+                    lib::AccLatencyData* acc =
+                        node_manager->GetAccLatData(nid, hash_index, filter_index);
+                    acc->sample_count = 0;
+                }
+            }
+        }
+    }
 }
 
 void
-process::TimingDistributor::_ResetTiming(
-    lib::LatencyData* curr_data, lib::LatencyData* next_data, int32_t time_value)
+process::TimingDistributor::_ResetTiming(lib::LatencyData* curr_data,
+    lib::LatencyData* next_data, int32_t time_value, uint32_t sampled_count)
 {
+    int32_t token {curr_data->start_token_size};
+    uint32_t minimum_sampled_count {lib::TIMELAG_SIZE / 4};         // 25%
+    uint32_t enough_sampled_count {(lib::TIMELAG_SIZE * 97) / 100}; // 97%
+    if (minimum_sampled_count > sampled_count)
+    {
+        if (MAX_TOKEN > token)
+        {
+            token += MIN_TOKEN;
+        }
+    }
+    else if (enough_sampled_count < sampled_count)
+    {
+        if (MIN_TOKEN < token)
+        {
+            token -= MIN_TOKEN;
+        }
+    }
+
     curr_data->start_deadline = time_value;
     curr_data->start_v.clear();
+    if (curr_data->access)
+    {
+        curr_data->start_v.reserve(token + 4);
+    }
+    curr_data->start_token_size = token;
     curr_data->start_state = lib::TimeLogState::IDLE;
+    curr_data->access = false;
 
     next_data->end_deadline = time_value;
     next_data->end_v.clear();
+    if (next_data->access)
+    {
+        next_data->end_v.reserve(token + 4);
+    }
+    next_data->end_token_size = token;
     next_data->end_state = lib::TimeLogState::IDLE;
+    next_data->access = false;
 }
diff --git a/src/process/TimingDistributor.h b/src/process/TimingDistributor.h
@@ -47,12 +47,14 @@ class TimingDistributor
 
 private:
     void _ResetTiming(lib::LatencyData* curr_data, lib::LatencyData* next_data,
-        int32_t time_value);
+        int32_t time_value, uint32_t sampled_count);
     std::random_device rand_device;
     std::default_random_engine rand_engine {rand_device()};
     std::uniform_int_distribution<int32_t> dist {1, 10};
     const uint32_t MAX_NID_SIZE {
         cfg::GetSentenceCount(config::ParagraphType::NODE)};
+    const int32_t MIN_TOKEN {static_cast<int32_t>(lib::TIMELAG_SIZE)};
+    const int32_t MAX_TOKEN {10 * static_cast<int32_t>(lib::TIMELAG_SIZE)};
 };
 
 } // namespace process
diff --git a/src/process/processor/LatencyProcessor.cpp b/src/process/processor/LatencyProcessor.cpp
@@ -157,7 +157,6 @@ process::LatencyProcessor::_InitData(lib::Data* air_data, lib::AccData* acc_data
     acc_lat_data->median = 0;
     acc_lat_data->lower_quartile = 0;
     acc_lat_data->upper_quartile = 0;
-    acc_lat_data->sample_count = 0;
     for (uint32_t i {0}; i < lib::TIMELAG_SIZE; i++)
     {
         acc_lat_data->timelag[i] = 0;

Original file line number	Diff line number	Diff line change
`@@ -68,7 +68,7 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)`
`68`	`68`	`lat_data->start_deadline--;`
`69`	`69`	`if (0 >= lat_data->start_deadline)`
`70`	`70`	`{`
`71`		`- lat_data->start_token = lib::LAT_TOKEN_SIZE;`
	`71`	`+ lat_data->start_token = lat_data->start_token_size;`
`72`	`72`	`lat_data->start_state = lib::TimeLogState::RUN;`
`73`	`73`	`}`
`74`	`74`	`}`
`@@ -78,7 +78,6 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)`
`78`	`78`	`if (-9 > lat_data->start_deadline)`
`79`	`79`	`{`
`80`	`80`	`lat_data->start_state = lib::TimeLogState::STOP;`
`81`		`- lat_data->access = false;`
`82`	`81`	`}`
`83`	`82`	`}`
`84`	`83`
`@@ -87,7 +86,7 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)`
`87`	`86`	`lat_data->end_deadline--;`
`88`	`87`	`if (0 >= lat_data->end_deadline)`
`89`	`88`	`{`
`90`		`- lat_data->end_token = lib::LAT_TOKEN_SIZE;`
	`89`	`+ lat_data->end_token = lat_data->end_token_size;`
`91`	`90`	`lat_data->end_state = lib::TimeLogState::RUN;`
`92`	`91`	`}`
`93`	`92`	`}`
`@@ -97,7 +96,6 @@ collection::SwitchGear::_CheckDeadline(lib::Data* data)`
`97`	`96`	`if (-9 > lat_data->end_deadline)`
`98`	`97`	`{`
`99`	`98`	`lat_data->end_state = lib::TimeLogState::STOP;`
`100`		`- lat_data->access = false;`
`101`	`99`	`}`
`102`	`100`	`}`
`103`	`101`	`}`
Original file line number	Diff line number	Diff line change
`@@ -157,7 +157,6 @@ process::LatencyProcessor::_InitData(lib::Data* air_data, lib::AccData* acc_data`
`157`	`157`	`acc_lat_data->median = 0;`
`158`	`158`	`acc_lat_data->lower_quartile = 0;`
`159`	`159`	`acc_lat_data->upper_quartile = 0;`
`160`		`- acc_lat_data->sample_count = 0;`
`161`	`160`	`for (uint32_t i {0}; i < lib::TIMELAG_SIZE; i++)`
`162`	`161`	`{`
`163`	`162`	`acc_lat_data->timelag[i] = 0;`