一个集群可以只有一个 monitor,我们推荐生产环境至少部署 3 个。 Ceph 使用 Paxos 算法的一个变种对各种 map 、以及其它对集群来说至关重要的信息达成共识。建议(但不是强制)部署奇数个 monitor 。Ceph 需要 mon 中的大多数在运行并能够互相通信,比如单个 mon,或 2 个中的 2 个,3 个中的 2 个,4 个中的 3 个等。初始部署时,建议部署 3 个 monitor。后续如果要增加,请一次增加 2 个。
- 在目标节点上,新建 mon 的默认目录。
{mon-id}
一般取为节点的 hostname 。
ssh {new-mon-host}
sudo mkdir /var/lib/ceph/mon/ceph-{mon-id}
- 创建一个临时目录(和第 1 步中的目录不同,添加 mon 完毕后需要删除该临时目录),来存放新增 mon 所需的各种文件。
mkdir {tmp}
- 获取 mon 的 keyring 文件,保存在临时目录下。
ceph auth get mon. -o {tmp}/{key-filename}
- 获取集群的 mon map 并保存到临时目录下。
ceph mon getmap -o {tmp}/{map-filename}
- 格式化在第 1 步中建立的 mon 数据目录。需要指定 mon map 文件的路径(获取法定人数的信息和集群的
fsid
)和 keyring 文件的路径。
sudo ceph-mon -i {mon-id} --mkfs --monmap {tmp}/{map-filename} --keyring {tmp}/{key-filename}
- 启动节点上的 mon 进程,它会自动加入集群。守护进程需要知道绑定到哪个 IP 地址,可以通过
--public-addr {ip:port}
选择指定,或在ceph.conf
文件中进行配置mon addr
。
ceph-mon -i {mon-id} --public-addr {ip:port}
还可以通过 ceph-deploy
工具很方便地增加 MON。
- 登入
ceph-deploy
工具所在的 Ceph admin 节点,进入工作目录。
ssh {ceph-deploy-node}
cd /path/ceph-deploy-work-path
- 执行下列命令,新增 Monitor:
ceph-deploy mon create {host-name [host-name]...}
注意: 在某一主机上新增 Mon 时,如果它不是由 ceph-deploy new
命令所定义的,那就必须把 public network
加入 ceph.conf
配置文件。
当你想要删除一个 mon 时,需要考虑删除后剩余的 mon 个数是否能够达到法定人数。
- 停止 mon 进程。
stop ceph-mon id={mon-id}
- 从集群中删除 monitor。
ceph mon remove {mon-id}
- 从 ceph.conf 中移除 mon 的入口部分(如果有)。
本小节介绍了如何从一个不健康的集群(比如集群中的 monitor 无法达成法定人数)中删除 ceph-mon
守护进程。
- 停止集群中所有的
ceph-mon
守护进程。
ssh {mon-host}
service ceph stop mon || stop ceph-mon-all
# and repeat for all mons
- 确认存活的 mon 并登录该节点。
ssh {mon-host}
- 提取 mon map。
ceph-mon -i {mon-id} --extract-monmap {map-path}
# in most cases, that's
ceph-mon -i `hostname` --extract-monmap /tmp/monmap
- 删除未存活或有问题的的 monitor。比如,有 3 个 monitors,
mon.a
、mon.b
和mon.c
,现在仅有mon.a
存活,执行下列步骤:
monmaptool {map-path} --rm {mon-id}
# for example,
monmaptool /tmp/monmap --rm b
monmaptool /tmp/monmap --rm c
- 向存活的 monitor(s) 注入修改后的 mon map。比如,把 mon map 注入
mon.a
,执行下列步骤:
ceph-mon -i {mon-id} --inject-monmap {map-path}
# for example,
ceph-mon -i a --inject-monmap /tmp/monmap
-
启动存活的 monitor。
-
确认 monitor 是否达到法定人数(
ceph -s
)。 -
你可能需要把已删除的 monitor 的数据目录
/var/lib/ceph/mon
归档到一个安全的位置。或者,如果你确定剩下的 monitor 是健康的且数量足够,也可以直接删除数据目录。
- 登入
ceph-deploy
工具所在的 Ceph admin 节点,进入工作目录。
ssh {ceph-deploy-node}
cd /path/ceph-deploy-work-path
- 如果你想删除集群中的某个 Mon ,可以用
destroy
选项。
ceph-deploy mon destroy {host-name [host-name]...}
注意: 确保你删除某个 Mon 后,其余 Mon 仍能达成一致。如果不可能,删除它之前可能需要先增加一个。