Elasticsearch7.9.3 集群-降级

wang_peng

于 2021-11-14 09:25:59 发布

阅读量2.9k

点赞数 5

文章标签： elasticsearch java 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wang_peng/article/details/117294875

版权

本文详细阐述了Elasticsearch单机多节点集群启动失败的常见原因，涉及选举配置、数据持久化和节点剔除策略。通过清空data目录、配置排除和逐步停机，教你如何在节点数量不足时恢复服务并避免数据丢失。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ElasticSearch启动失败：master not discovered or elected yet, an election requires at least X nodes with ids from [XXXXX]

做一个单机三个节点的集群, 如果一次性全部停掉,再启动master节点时,就会提示上面的信息

主要有两点原因,

1)如果ES集群是第一次启动时,已经加入集群的几点信息保存在data目录下，以供下次启动使用，这样也就是说cluster.initial_master_nodes就不在起作用了

2)每个ES集群都维护一个选举配置集合(Voting Configurations),这个选举集合由可以选举为主节点的master类型节点组成.它除了提供选举功能，还决定者集群的状态，当选举配置集合中超过一半的节点存活时，集群才提供服务（也就是过半原则，通常集群解决脑裂问题都是采用这种方式）.也就是说3个节点,挺掉一个,还有两个,属于过半了,不会有什么问题.但如果一下3个全停了,那就完犊子了.三个服务都彻底不能用了

但如果不愿意启动多个节点，也就是要将多节点集群降级，也就是如何减少集群中的节点数呢？发现很多推荐做法是清空data目录，确实这样相当于重新启动而创建一个全新的集群，可以解决问题，但是结果是导致所有的数据丢失.所以只能一个一个的停,每停一个节点,向主节点的voting_config_exclusions中添加一下要删除节点的ID或者名称

具体操作:

1) 添加排除，也就是从配置集合中删除,可以使用节点Id(node_ids)或者节点名称(node_names)来排除,如果执行失败.加上参数 wait_for_removal=false 试试

用PostMan向主节点Post http://localhost:9201/_cluster/voting_config_exclusions?node_names=node-1002,node-1003

2) 查看排除列表

用PostMan向主节点Get http://localhost:9201/_cluster/state?filter_path=metadata.cluster_coordination.voting_config_exclusions&pretty

3)然后就可以停掉节点node-1002,node1003

4)清空列表用PostMan向主节点 Delete http://localhost:9201/_cluster/voting_config_exclusions

博客等级

码龄19年

85
原创

150
点赞

186
收藏

113
粉丝

关注

私信

热门文章

分类专栏

NetCore 3.1 16篇
Vue 5篇
其他 3篇
SpringBoot 9篇
MySql 4篇
Docker 8篇
git 5篇
SpringCloud 7篇
Redis 8篇
微服务 12篇
Elasticsearch 7篇

展开全部收起

上一篇：: 小程序开发-资料

下一篇：: vs2019添加gitee

最新评论

程序员最常用的技术博客
仨三到四: 哈哈哈，第四条有意思
7.Cloud-GateWay
CSDN-Ada助手: 云原生入门技能树或许可以帮到你：https://edu.csdn.net/skill/cloud_native?utm_source=AI_act_cloud_native
Apollo-1.开发部署-linux
wang_peng: 那就多做几遍，一切从0开始，linux也重新装，我用的centors7, 实在折磨的不行就放弃纯linux环境的，测试用windows的，生产用docker版本，docker基本有手就能部署成功。 linux版的基本都是那些老程序员喜欢这样干
Apollo-1.开发部署-linux
Levi-Elvin: 为什么我在linux环境下启动，总是报错启动不起来呢？ [root@master apollo]# ./startup.bat ./startup.bat:行1: /home/levi/apollo/apollo-configservice-2.1.0-github/apollo-configservice-2.1.0-github/scr: 没有那个文件或目录 ./startup.bat:行2: /home/levi/apollo/apollo-adminservice-2.1.0-github/apollo-adminservice-2.1.0-github/scrip: 没有那个文件或目录 2023年 10月 03日星期二 14:16:56 CST ==== Starting ==== Started [6854] Waiting for server startup. pid - 6854 just quit unexpectedly, please check logs under /opt/logs/100003173 and /tmp for more information!
NetCore+Docker-手动发布
菜码代码: 拼多多，活动真实有效

大家在看

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wang_peng 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。