MongoDB 平常运维实践总结

时间 2021-03-18 标签 node 程序员 mongodb docker 数据库缓存安全 bash 服务器网络

1、MongoDB 集群简介

MongoDB是一个基于分布式文件存储的数据库，其目的在于为WEB应用提供可扩展的高性能数据存储解决方案。下面将以3台机器介绍最多见的集群方案。具体介绍，能够查看官网 https://docs.mongodb.com/v3.4...。node

一、集群组件的介绍

mongos（路由处理）：做为Client与MongoDB集群的请求入口，全部用户请求都会透过Mongos协调，它会将数据请求发到对应的Shard(mongod)服务器上，再将数据合并后回传给用户。程序员

config server（配置节点）：即：配置服务器；主要保存数据库的元数据，包含数据的分布(分片)以及数据结构，mongos收到client发出的需求后，会从config server加载配置信息并缓存于内存中。通常在生产环境会配置不仅一台config server，由于它保存的元数据极为重要，若损坏则影响整个集群运做。mongodb

shard（分片实例存储数据）：shard就是分片。MongoDB利用分片的机制来实现数据分布存储与处理，达到横向扩容的目的。默认状况下，数据在分片之间会自动进行移转，以达到平衡，此动做是靠一个叫平衡器(balancer)的机制达成。docker

replica set（副本集）：副本集实现了数据库高可用，若没作副本集，则一旦存放数据的服务器节点挂掉，数据就丢失了，相反若配置了副本集，则一样的数据会保存在副本服务器中(副本节点)，通常副本集包含了一个主节点与多个副本节点，必要时还会配置arbiter(仲裁节点)做为节点挂掉时投票用。数据库

arbiter（仲裁节点）：仲裁服务器自己不包含数据，仅能在主节点故障时，检测全部副本服务器并选举出新的主节点，其实现方式是经过主节点、副本节点、仲裁服务器之间的心跳(Heart beat)实现。缓存

二、MongoDB应用场景

网站数据：适合实时的插入，更新与查询，并具有网站实时数据存储所需的复制及高度伸缩性。安全

缓存：因为性能很高，也适合做为信息基础设施的缓存层。在系统重启以后，搭建的持久化缓存能够避免下层的数据源过载。bash

大尺寸、低价值的数据：使用传统的关系数据库存储一些数据时可能会比较贵，在此以前，不少程序员每每会选择传统的文件进行存储。服务器

高伸缩性的场景：很是适合由数十或者数百台服务器组成的数据库。网络

用于对象及JSON数据的存储：MongoDB的BSON数据格式很是适合文档格式化的存储及查询。

三、选用MongoDB的原因

选用MongoDB的数据是以BSON的数据格式，高度伸缩方便扩展，而且数据水平扩展很是简单，支持海量数据存储，性能强悍。

2、集群的监测

一、监测数据库存储统计信息

docker中进入mongos或shard实例，执行如下命令：

docker exec -it mongos bash;
mongo --port 20001;
use admin;
db.auth("root","XXX");

说明:经过此命令，能够查询集群的成员的集合数量、索引数量等相关数据。13个Mongodb GUI可视化管理工具，总有一款适合你

db.stats();

二、查看数据库的统计信息

说明：经过此命令，能够查看操做数量、内存使用情况、网络io等

db.runCommand( { serverStatus: 1 } )；

三、检查复制集成员状态

rs.status()；

3、基本的运维操做

一、设置和查看慢查询

# 设置慢查询
db.setProfilingLevel(1,200);
# 查看慢查询级别
db.getProfilingLevel();
# 查询慢查询日志，此命令是针对于某一库进行设置
db.system.profile.find({ ns : 'dbName.collectionName'}).limit(10).sort( { ts : -1 } ).pretty();

二、查看执行操做时间较长的动做

db.currentOp({"active" : true,"secs_running" : { "$gt" : 2000 }});

三、动态调整日志级别和设置缓存大小

# 设置日志级别参数
db.adminCommand( { "getParameter": 1, "logLevel":1});
# 设置cache大小参数
db.adminCommand( { "setParameter": 1, "wiredTigerEngineRuntimeConfig": "cache_size=4G"});

四、添加和移除复制集成员

# 查看复制集成员
rs.status().members;
# 添加成员
rs.add('127.0.0.1:20001')；
# 移除成员
rs.remove('127.0.0.1:20001')；

五、设置数据库和集合分片

# 在mongos admin库设置库容许分片
sh.enableSharding("dbName");
# 在mongos 的admin库设置集合分片片键
sh.shardCollection("dbName.collectionName", { filedName: 1} );

六、添加和移除分片

# 查看分片状态
sh.status()；
# 在mongos执行添加分片（能够为单个实例或复制集）
db.runCommand( { removeShard: "shardName" } )；
db.runCommand({addshard:"rs1/ip-1:20001,ip-2:20001,ip-3:20001"});
# 在mongos执行移除分片
db.runCommand( { removeShard: "shard3" } )；
# 在mongos执行刷新mongos配置信息
db.runCommand("flushRouterConfig"))；

说明：移除分片命令至少执行两次才能成功删除，执行到state为completed才真正删除，不然就是没用删除成功，该分片处于{"draining" : true}状态，该状态下不但该分片没用删除成功，并且还影响接下来删除其余分片操做，遇到该状态再执行一次removeshard便可，最好就是删除分片时一直重复执行删除命令，直到state为completed；还有一个须要注意的地方就是：被成功删除的分片若是想要再加入集群时，必须将data数据目录清理干净才能够再加入集群，不然即便能加入成功也不会存储数据，集合都不会被建立。

另外：在删除分片的时有可能整个过程出现无限{"draining" : true}状态，等多久仍是这样，并且分片上面的块一个都没有移动到别的分片，解决办法是：在config的config数据库的shard集合中找到该分片的信息，并将draining字段由True改成False,再继续试着删除操做” 上面这句会当即返回，实际在后台执行。在数据移除的过程中，必定要注意实例的日志信息，可能出现数据块在迁移的过程当中，始终找不到边界条件，致使一直数据迁移不成功，一直重试，解决方案是删除边界数据，重启实例。

若是此分片为主分片，须要先迁移主分片。db.runCommand( { movePrimary: "XXX", to: "other" })；在完成删除后，全部mongos上运行下面命令，再对外提供服务，固然也能够从新启动全部mongos实例。

七、数据的导入导出

# 导出容许指定导出条件和字段
mongoexport -h 127.0.0.1 --port 20001 -uxxx -pxxx -d xxx -c mobileIndex -o XXX.txt 
mongoimport -h 127.0.0.1 --port 20001 -uxxx -pxxx -d xxx -c mobileIndex --file XXX.txt

4、MongoDB数据迁移

一、迁移复制集当中的成员

关闭 mongod 实例,为了确保安全关闭,使用 shutdown 命令；
将数据目录(即 dbPath )转移到新机器上；
在新机器上启动 mongod，其中节点的数据目录为copy的文件目录；
链接到复制集当前的主节点上；

若是新节点的地址发生变化,使用 rs.reconfig() 更新复制集配置文档；举例,下面的命令过程将成员中位于第 2 位的地址进行更新:

cfg = rs.conf()
cfg.members[2].host = "127.0.0.1:27017"
rs.reconfig(cfg)

使用 rs.conf() 确认使用了新的配置. 等待全部成员恢复正常,使用 rs.status() 检测成员状态。

二、迁移复制集主节点

在迁移主节点的时候,须要复制集选举出一个新的主节点,在进行选举的时候,复制集将读写,一般,这只会持续很短的时间,不过,应该尽量在影响较小的时间段内迁移主节点.

主节点降级,以使得正常的 failover开始.要将主节点降级,链接到一个主节点,使用 replSetStepDown方法或者使用rs.stepDown()方法,下面的例子使用了 rs.stepDown()方法进行降级:

rs.stepDown()

等主节点降级为从节点,另外一个成员成为 PRIMARY 以后,能够按照 “迁移复制集的一个成员”迁移这个降级了的节点.可使用 rs.status()来确认状态的改变。

三、从复制集其余节点恢复数据

MongoDB 经过复制集能保证高可靠的数据存储，一般生产环境建议使用「3节点复制集」，这样即便其中一个节点崩溃了没法启动，咱们能够直接将其数据清掉，从新启动后，以全新的 Secondary 节点加入复制集，或者是将其余节点的数据复制过来，从新启动节点，它会自动的同步数据，这样也就达到了恢复数据的目的。

关闭须要数据同步的节点

docker stop node;  # docker环境中
db.shutdownServer({timeoutSecs: 60}); # 非docker环境

拷贝目标节点机器的数据存储目录(/dbPath)到当前机器的指定目录。

scp 目标节点 shard/data -> 当前节点 shard/data

当前节点以复制过来的数据文件启动节点

将新的节点添加到复制集

# 进入复制集的主节点，执行添加新的节点命令
rs.add("hostNameNew:portNew"); 
# 等待全部成员恢复正常,检测成员状态
rs.status();
# 移除原来的节点
rs.remove("hostNameOld>:portOld");

5、MongoDB线上问题场景解决

一、MongoDB 新建索引致使库被锁

问题说明：某线上千万级别集合，为优化业务，直接执行新建索引命令，致使整个库被锁，应用服务出现不可用。

解决方案：找出此操做进程，而且杀死。改成后台新建索引，速度会很慢，可是不会影响业务，该索引只会在新建完成以后，才会生效；

# 查询运行时间超过200ms操做 
db.currentOp({"active" : true,"secs_running" : { "$gt" : 2000 }}) ；
# 杀死执行时间过长操做操做
db.killOp(opid)
# 后台新建索引
db.collectionNmae.ensureIndex({filedName:1}, {background:true});

二、MongoDB没有限制内存，致使实例退出

问题说明：生产环境某台机器启动多个mongod实例，运行一段时间事后，进程莫名被杀死；

解决方案：如今MongoDB使用WiredTiger做为默认存储引擎，MongoDB同时使用WiredTiger内部缓存和文件系统缓存。从3.4开始，WiredTiger内部缓存默认使用较大的一个：50％（RAM - 1 GB），或256 MB。例如，在总共4GB RAM的系统上，WiredTiger缓存将使用1.5GB的RAM（）。相反，具备总共1.25 GB RAM的系统将为WiredTiger缓存分配256 MB，由于这超过总RAM的一半减去1千兆字节（）。

0.5 * (4 GB - 1GB) = 1.5 GB``0.5 * (1.25 GB - 1 GB) = 128 MB < 256 MB。若是一台机器存在多个实例，在内存不足的情景在，操做系统会杀死部分进程；
# 要调整WiredTiger内部缓存的大小，调节cache规模不须要重启服务，咱们能够动态调整：
db.adminCommand( { "setParameter": 1, "wiredTigerEngineRuntimeConfig": "cache_size=xxG"})

三、MongoDB删除数据，不释放磁盘空间

问题说明：在删除大量数据(本人操做的数据量在2000万+)的情景下，而且在生产环境中请求量较大，此时机器的cpu负载会显得很高，甚至机器卡顿没法操做，这样的操做应该谨慎分批量操做；在删除命令执行结束以后，发现磁盘的数据量大小并无改变。

解决方案：

方案一：咱们可使用MongoDB提供的在线数据收缩的功能，经过Compact命令db.collectionName.runCommand("compact")进行Collection级别的数据收缩，去除集合所在文件碎片。此命令是以Online的方式提供收缩，收缩的同时会影响到线上的服务。为了解决这个问题，能够先在从节点执行磁盘整理命令，操做结束后，再切换主节点，将原来的主节点变为从节点，从新执行Compact命令便可。
方案二：使用从节点从新同步，secondary节点重同步，删除secondary节点中指定数据，使之与primary从新开始数据同步。当副本集成员数据太过陈旧，也可使用从新同步。数据的从新同步与直接复制数据文件不一样，MongoDB会只同步数据，所以重同步完成后的数据文件是没有空集合的，以此实现了磁盘空间的回收。
针对一些特殊状况，不能下线secondary节点的，能够新增一个节点到副本集中，而后secondary就自动开始数据的同步了。总的来讲，重同步的方法是比较好的，第一基本不会阻塞副本集的读写，第二消耗的时间相对前两种比较短。
如果primary节点，先强制将之变为secondary节点，不然跳过此步骤：rs.stepdown(120)；
而后在primary上删除secondary节点：rs.remove("IP:port");
删除secondary节点dbpath下的全部文件
将节点从新加入集群，而后使之自动进行数据的同步：rs.add("IP:port");
等数据同步完成后，循环1-4的步骤能够将集群中全部节点的磁盘空间释放

四、MongoDB机器负载极高

问题说明：此情景是在客户请求较大的情景性，因为部署MongoDB的机器包含一主一从，MongoDB使得IO100%，数据库阻塞，出现大量慢查询，进而致使机器负载极高，应用服务彻底不可用。

解决方案：在没有机器及时扩容的情况下，首要任务即是减少机器的IO，在一台机器出现一主一从，在大量数据写入的状况下，会互相抢占IO资源。因而此时摒弃了MongoDB高可用的特色，摘掉了复制集当中的从节点，保证每台机器只有一个节点能够占用磁盘资源。以后，机器负载立马下来，服务变为正常可用状态，可是此时MongoDB没法保证数据的完整性，一旦有主节点挂掉便会丢失数据。

此方案只是临时方法，根本解决是能够增长机器的内存、使用固态硬盘，或者采用增长分片集来减小单个机器的读写压力。

# 进入主节点，执行移除成员的命令
rs.remove("127.0.0.1:20001");
# 注意：切勿直接关停实例

五、MongoDB分片键选择不当致使热读热写

问题说明：生产环境中，某一集合的片键使用了与_id生成方式类似，含有时间序列的字段做为升序片键，致使数据写入时都在一个数据块，随着数据量增大，会形成数据迁移到前面的分区，形成系统资源的占用，偶尔出现慢查询。

解决方案：临时方案设置数据迁移的窗口，放在在正常的时间区段，对业务形成影响。根本解决是更换片键。

# 链接mongos实例，执行如下命令
db.settings.update({ _id : "balancer" }, { $set : { activeWindow : { start : "23:00", stop : "4:00" } } }, true )；
# 查看均衡窗口
sh.getBalancerWindow()；

6、MongoDB优化建议

一、应用层面优化

查询优化：确认你的查询是否充分利用到了索引，用explain命令查看一下查询执行的状况，添加必要的索引，避免扫表操做。

合理设计分片键：

增量sharding-key：适合于可划分范围的字段，好比integer、float、date类型的，查询时比较快。
随机sharding-key: 适用于写操做频繁的场景，而这种状况下若是在一个shard上进行会使得这个shard负载比其余高,不够均衡，故而但愿能hash查询key，将写分布在多个shard上进行,考虑复合key做为sharding key，总的原则是查询快，尽可能减小跨shard查询，balance均衡次数少；
单一递增的sharding key，可能会形成写数据所有在最后一片上，最后一片的写压力增大，数据量增大，会形成数据迁移到前面的分区。MongoDB默认是单条记录16M，尤为在使用GFS的时候，必定要注意shrading-key的设计。不合理的sharding-key会出现，多个文档，在一个chunks上，同时，由于GFS中存贮的每每是大文件，致使MongoDB在作balance的时候没法经过sharding-key来把这多个文档分开到不一样的shard上，这时候MongoDB会不断报错最后致使MongoDB倒掉。解决办法：加大chunks大小（治标），设计合理的sharding-key（治本）。

经过profile来监控数据：进行优化查看当前是否开启profile功能,用命令db.getProfilingLevel() 返回level等级，值为0|1|2，分别表明意思：0表明关闭，1表明记录慢命令，2表明所有。开启profile功能命令为 db.setProfilingLevel(level); #level等级，值level为1的时候，慢命令默认值为100ms，更改成db.setProfilingLevel(level,slowms)如db.setProfilingLevel(1,50)这样就更改成50毫秒经过db.system.profile.find() 查看当前的监控日志。

二、硬件层面优化

2.1 肯定热数据大小

可能你的数据集很是大，可是这并不那么重要，重要的是你的热数据集有多大，你常常访问的数据有多大(包括常常访问的数据和全部索引数据)。使用MongoDB，你最好保证你的热数据在你机器的内存大小之下，保证内存能容纳全部热数据；

2.2 选择正确的文件系统

MongoDB的数据文件是采用的预分配模式，而且在Replication里面，Master和Replica Sets的非Arbiter节点都是会预先建立足够的空文件用以存储操做日志。这些文件分配操做在一些文件系统上可能会很是慢，致使进程被Block。因此咱们应该选择那些空间分配快速的文件系统。这里的结论是尽可能不要用ext3，用ext4或xfs；

三、架构上的优化

尽量让主从节点分摊在不一样的机器上，避免IO操做的与MongoDB在同一台机器；

7、总结

MongoDB具备高性能、易扩展、易上手等特色，在正确使用的状况下，其自己性能仍是很是强悍，在一些关键点如片键的选择、内存的大小和磁盘IO，每每是限制其性能的最大瓶颈。针对于片键，在业务系统初期，能够先不对集合进行数据分片，由于分片键一旦肯定就没法修改，后期可根据业务系统的状况，认真筛选字段。

通常状况下，不建议使用升序片键（是一种随着时间稳定增加的字段,自增加的主键是升序键），由于这个会致使局部的热读热写，不能发挥分片集群的真正实力。建议使用hash片键或者随机分发的片键，这样能够保证数据的均匀分发在分片节点；针对于内存，建议内存的大小可以包含热数据的大小加索引大小，保证内存能容纳全部热数据。

针对于磁盘资源，MongoDB的高速读写是以磁盘的IO做为基础，为了保证其性能，建议将主从节点以及高IO的应用分离，以保证IO资源尽量不存在抢占。

原文连接：https://www.jianshu.com/p/f05...