Elasticsearch 横向扩容以及容错机制

写在前面的话：读书破万卷，编码若有神
--------------------------------------------------------------------node

参考内容：服务器

　　《Elasticsearch顶尖高手系列-快速入门篇》，中华石杉负载均衡

--------------------------------------------------------------------性能

主要内容包括:编码

横向扩容
容错机制

--------------------------------------------------------------------spa

一、Elasticsearch横向扩容资源

1.一、primary shard 和 replica shard自动负载均衡同步

目前状况：2个node， 3个primary shard，3个replica shard入门

若是此时给es集群增长一个节点(node),es会自动对primary shard和replica shard进行负载均衡ast

1.二、每一个Node有更少的shard, IO/CPU/Memory资源给每一个shard分配更多，每一个shard性能更好

1.三、扩容的极限，6个shard(3个primary shard,3个replica shard),最多扩容到6台机器，每一个shard能够占用单台服务器的全部资源，性能最好

--------------------------------------------------------------------

二、Elasticsearch容错机制

2.一、master选举、replica容错、数据恢复

目前es集群状况：3个node，9个shard(3个primary shard,6个replica shard)

若是此时master node宕机：

由于Node1节点宕机了，因此primary shard0、replica shard一、replica shard2三个3shard就丢失了。master node宕机的一瞬间，primary shard0这个shard就没有了，此时就不是active status,因此集群的状态为red.

容错第一步：master选举，自动选举另一个node成为新的master，承担起master的责任来：

容错第二步：新master将丢失的primary shard的某个replica shard提高为primary shard，此时cluster status会变为Yellow，由于全部的primary shard都变成了active status，可是，少了一个replica shard，因此不是全部的replica shard都是active。

容错第三步：重启故障的node, new master节点将会把缺失的副本都copy一份到该node上去，并且该node会使用以前已有的shard数据，只是同步一下宕机以后发生的改变。

此时es cluster的状态为green，由于全部的primary shard和replica shard都是active状态。

--------------------------------------------------------------------