add hybrid-deployment-topology.md (#3227)

pingcap · May 26, 2020 · de4b3de · de4b3de
1 parent bca4998
commit de4b3de
Showing 1 changed file with 110 additions and 0 deletions.
diff --git a/hybrid-deployment-topology.md b/hybrid-deployment-topology.md
@@ -0,0 +1,110 @@
+---
+title: 混合部署拓扑
+summary: 介绍混合部署 TiDB 集群的拓扑结构。
+category: how-to
+---
+
+# 混合部署拓扑
+
+本文介绍 TiDB 集群的 TiKV 和 TiDB 混合部署拓扑以及主要参数。
+
+## 拓扑信息
+
+| 实例 | 个数 | 物理机配置 | IP | 配置 |
+| :-- | :-- | :-- | :-- | :-- |
+| TiDB | 6 | 32 VCore 64GB | 10.0.1.1<br> 10.0.1.2<br> 10.0.1.3 | 配置 numa 绑核操作 |
+| PD | 3 | 16 VCore 32 GB | 10.0.1.4<br> 10.0.1.5<br> 10.0.1.6 | 配置 location_lables 参数 |
+| TiKV | 6 | 32 VCore 64GB | 10.0.1.7<br> 10.0.1.8<br> 10.0.1.9 | 1. 区分实例级别的 port、status_port；<br> 2. 配置全局参数 readpool、storage 以及 raftstore 参数；<br> 3. 配置实例级别 host 维度的 labels；<br> 4. 配置 numa 绑核操作|
+| Monitoring & Grafana | 1 | 4 VCore 8GB * 1 500GB (ssd)  | 10.0.1.10 | 默认配置 |
+
+## 通过 TiUP 部署集群的配置文件模版 topology.yaml
+
+### 部署目标
+
+部署 TiDB 和 TiKV 组件的物理机为 2 路处理器，每路 16 VCore，内存也达标，为提高物理机资源利用率，可为单机多实例，即 TiDB、TiKV 通过 numa 绑核，隔离 CPU 资源。PD 和 Prometheus 混合部署，但两者的数据目录需要使用独立的文件系统。
+
+### 拓扑模版
+
+[简单混部配置模板](/config-templates/simple-multi-instance.yaml)
+
+[详细混部配置模板](/config-templates/complex-multi-instance.yaml)
+
+### 混合部署的关键参数介绍
+
+本节介绍单机多实例的关键参数，主要用于 TiDB、TiKV 的单机多实例部署场景。你需要按照提供的计算公式，将结果填写至上一步的配置模板中。
+
+- TiKV 进行配置优化
+
+    - readpool 线程池自适应，配置 `readpool.unified.max-thread-count` 参数可以使 `readpool.storage` 和 `readpool.coprocessor` 共用统一线程池，同时要分别设置自适应开关。
+
+        - 开启 `readpool.storage` 和 `readpool.coprocessor`：
+          
+            ```yaml
+            readpool.storage.use-unified-pool: false
+            readpool.coprocessor.use-unified-pool: true
+            ```
+
+        - 计算公式如下：
+
+            ```
+            readpool.unified.max-thread-count = cores * 0.8 / TiKV 数量
+            ```
+
+    - storage CF (all RocksDB column families) 内存自适应，配置 `storage.block-cache.capacity` 参数即可实现 CF 之间自动平衡内存使用。
+
+        - `storage.block-cache` 默认开启 CF 自适应，无需修改。
+
+            ```yaml
+            storage.block-cache.shared: true
+            ```
+     
+        - 计算公式如下：
+
+            ```
+            storage.block-cache.capacity = (MEM_TOTAL * 0.5 / TiKV 实例数量)
+            ```
+
+    - 如果多个 TiKV 实例部署在同一块物理磁盘上，需要在 tikv 配置中添加 capacity 参数：
+
+        ```
+        raftstore.capacity = 磁盘总容量 / TiKV 实例数量
+        ```
+
+- label 调度配置
+
+    由于采用单机多实例部署 TiKV，为了避免物理机宕机导致 Region Group 默认 3 副本的 2 副本丢失，导致集群不可用的问题，可以通过 label 来实现 PD 智能调度，保证同台机器的多 TiKV 实例不会出现 Region Group 只有 2 副本的情况。
+
+    - TiKV 配置
+
+        相同物理机配置相同的 host 级别 label 信息：
+
+        ```yml
+        config:
+          server.labels:
+            host: tikv1
+        ```
+
+    - PD 配置
+
+        PD 需要配置 labels 类型来识别并调度 Region：
+
+        ```yml
+        pd:
+          replication.location-labels: ["host"]
+        ```
+
+- `numa_node` 绑核
+
+    - 在实例参数模块配置对应的 `numa_node` 参数，并添加对应的物理 CPU 的核数；
+
+    - numa 绑核使用前，确认已经安装 numactl 工具，以及物理机对应的物理机 CPU 的信息后，再进行参数配置；
+
+    - `numa_node` 这个配置参数与 `numactl --membind` 配置对应。 
+
+> **注意：**
+>
+> - 编辑配置文件模版时，注意修改必要参数、IP、端口及目录。
+>
+> - 各个组件的 deploy_dir，默认会使用 global 中的 <deploy_dir>/<components_name>-<port>。例如 tidb 端口指定 4001，则 deploy_dir 默认为 /tidb-deploy/tidb-4001。因此，在多实例场景下指定非默认端口时，无需再次指定目录。
+>
+> - 无需手动创建配置文件中的 `tidb` 用户，TiUP cluster 组件会在部署主机上自动创建该用户。可以自定义用户，也可以和中控机的用户保持一致。