MongoDB入门---复制(副本集)&分片管理

     今天来分享的是MongoDB中比较重要的一部分,那就是关于MongoDB数据库的复制(也叫作制作副本集)和分片管理(集群配置)。首先呢,我们来看一下复制这个东西是什么鬼呢。

    MongoDB复制是将数据同步在多个服务器的过程。复制提供了数据的冗余备份,并在多个服务器上存储数据副本,提高了数据的可用性,并可以保证数据的安全性。复制还允许你从硬件故障和服务中断中恢复数据。总结几个特点哈:

  • 保障数据的安全性
  • 数据高可用性 (24*7)
  • 灾难恢复
  • 无需停机维护(如备份,重建索引,压缩)
  • 分布式读取数据

    好的,看到这里我们对这个叫做复制的鬼,有了一个大概的印象了,接下来咱们就来看一下MongoDB它的复制原理。mongodb的复制至少需要两个节点。其中一个是主节点,负责处理客户端请求,其余的都是从节点,负责复制主节点上的数据。mongodb各个节点常见的搭配方式为:一主一从、一主多从。主节点记录在其上的所有操作oplog,从节点定期轮询主节点获取这些操作,然后对自己的数据副本执行这些操作,从而保证从节点的数据与主节点一致。

    那就来看一下它的结构图是什么鬼吧:


    以上结构图中,客户端从主节点读取数据,在客户端写入数据到主节点时,主节点与从节点进行数据交互保障数据的一致性。知道了这些,咱们就来看一下MongoDB的副本集有什么特征吧:

  • N 个节点的集群
  • 任何节点可作为主节点
  • 所有写入操作都在主节点上
  • 自动故障转移
  • 自动恢复

  好吧,到这里,就了解的差不多了。那咱们也不废话了,直接来看一个实例:

  我们先关闭MongoDB服务器,然后呢,通过指定 --replSet 选项来启动mongoDB。语法格式如下:

mongod --port "PORT" --dbpath "YOUR_DB_DATA_PATH" --replSet "REPLICA_SET_INSTANCE_NAME"

    OK,看一下具体的实例:

mongod --port 27017 --dbpath "D:\set up\mongodb\data" --replSet rs0

   上面的实例会启动一个名为rs0的MongoDB实例,其端口号为27017。启动后打开命令提示框并连接上mongoDB服务。在Mongo客户端使用命令rs.initiate()来启动一个新的副本集。我们可以使用rs.conf()来查看副本集的配置,查看副本集状态使用 rs.status() 命令。

    接下来呢,我们就来添加一个副本集的成员,需要使用多台服务器来启动mongo服务。进入Mongo客户端,并使用rs.add()方法来添加副本集的成员。看一下rs.add()方法的语法格式:

>rs.add(HOST_NAME:PORT)

    咱们直接进行实例哈,假设你已经启动了一个名为mongod1.net,端口号为27017的Mongo服务。在客户端命令窗口使用rs.add() 命令将其添加到副本集中,命令如下所示:

>rs.add("mongod1.net:27017")
>

      MongoDB中你只能通过主节点将Mongo服务添加到副本集中,判断当前运行的Mongo服务是否为主节点可以使用命令db.isMaster()。MongoDB的副本集与我们常见的主从有所不同,主从在主机宕机后所有服务将停止,而副本集在主机宕机后,副本会接管主节点成为主节点,不会出现宕机的情况。

    好的,到这里呢,我们的MongoDB的复制就完事了,接下来就来看一下它的分片管理哈,先来看一下介绍:

    在Mongodb里面存在另一种集群,就是分片技术,可以满足MongoDB数据量大量增长的需求。当MongoDB存储海量的数据时,一台机器可能不足以存储数据,也可能不足以提供可接受的读写吞吐量。这时,我们就可以通过在多台机器上分割数据,使得数据库系统能存储和处理更多的数据。

    那么,我们为什么使用MongoDB的分片管理呢:

  • 复制所有的写入操作到主节点
  • 延迟的敏感数据会在主节点查询
  • 单个副本集限制在12个节点
  • 当请求量巨大时会出现内存不足。
  • 本地磁盘不足
  • 垂直扩展价格昂贵

    首先我们来看一下,分片的结构图:

  上面的图片主要有如下所述的三个主要组件:

  • Shard:

    用于存储实际的数据块,实际生产环境中一个shard server角色可由几台机器组个一个replica set承担,防止主机单点故障

  • Config Server:

    mongod实例,存储了整个 ClusterMetadata,其中包括 chunk信息。

  • Query Routers:

    前端路由,客户端由此接入,且让整个集群看上去像单一数据库,前端应用可以透明使用。

    接下来呢咱们就直接来看一下实例哈,首先呢,分片结构端口分布如下:

Shard Server 127020
Shard Server 227021
Shard Server 327022
Shard Server 427023
Config Server 27100
Route Process40000

    再来呢,我们来启动Shard Server:

[[email protected] /]# mkdir -p /www/mongoDB/shard/s0
[[email protected] /]# mkdir -p /www/mongoDB/shard/s1
[[email protected] /]# mkdir -p /www/mongoDB/shard/s2
[[email protected] /]# mkdir -p /www/mongoDB/shard/s3
[[email protected] /]# mkdir -p /www/mongoDB/shard/log
[[email protected] /]# /usr/local/mongoDB/bin/mongod --port 27020 --dbpath=/www/mongoDB/shard/s0 --logpath=/www/mongoDB/shard/log/s0.log --logappend --fork
....
[[email protected] /]# /usr/local/mongoDB/bin/mongod --port 27023 --dbpath=/www/mongoDB/shard/s3 --logpath=/www/mongoDB/shard/log/s3.log --logappend --fork

    然后嘞,启动Config Server:

[[email protected] /]# mkdir -p /www/mongoDB/shard/config
[[email protected] /]# /usr/local/mongoDB/bin/mongod --port 27100 --dbpath=/www/mongoDB/shard/config --logpath=/www/mongoDB/shard/log/config.log --logappend --fork

      需要注意的是,这里我们完全可以像启动普通mongodb服务一样启动,不需要添加—shardsvr和configsvr参数。因为这两个参数的作用就是改变启动端口的,所以我们自行指定了端口就可以。

    再来呢,启动Route Process:

/usr/local/mongoDB/bin/mongos --port 40000 --configdb localhost:27100 --fork --logpath=/www/mongoDB/shard/log/route.log --chunkSize 500

    再来声明一下哈:mongos启动参数中,chunkSize这一项是用来指定chunk的大小的,单位是MB,默认大小为200MB。

    了解了这一些的话,我们再来配置Sharding,使用MongoDB Shell登录到mongos,添加Shard节点:

[[email protected] shard]# /usr/local/mongoDB/bin/mongo admin --port 40000
MongoDB shell version: 2.0.7
connecting to: 127.0.0.1:40000/admin
mongos> db.runCommand({ addshard:"localhost:27020" })
{ "shardAdded" : "shard0000", "ok" : 1 }
......
mongos> db.runCommand({ addshard:"localhost:27029" })
{ "shardAdded" : "shard0009", "ok" : 1 }
mongos> db.runCommand({ enablesharding:"test" }) #设置分片存储的数据库
{ "ok" : 1 }
mongos> db.runCommand({ shardcollection: "test.log", key: { id:1,time:1}})
{ "collectionsharded" : "test.log", "ok" : 1 }

    最后的话,程序代码内无需太大更改,直接按照连接普通的mongo数据库那样,将数据库连接接入接口40000。

    到这里呢,今天的分享就差不多完事了,嘿嘿,说实话,我也就是照着一步一步做,不求甚解啊,具体的什么原理啊,运行机制啊,本人正在了解中,还在蒙圈中。。。

    本人学习笔记哈,各位勿喷哦,如果觉得不错的话,可以多多点赞支持哦。。。