聊聊数据库~5.SQL运维上篇

时间 2019-11-07 标签聊聊数据库 5.sql 5 sql 运维上篇

1.6.SQL运维篇

运维这块逆天只能说够用，并不能说擅长，因此这篇就当抛砖之用，欢迎补充和纠错html

PS：再说明下CentOS优化策略这部分的内容来源：首先这块逆天不是很擅长，因此主要是参考网上的DBA文章，以后请教了下运维相关的朋友，你们辩证看就好了，我只能保证90%的准确度（具体看业务）mysql

1.6.1.概念

1.RAID系

RAID：磁盘冗余队列linux

把多个容量小的磁盘组成一组容量更大的磁盘，并提供数据冗余来保证数据完整性的技术redis

RAID0：数据条带（好处：成本低，应用：数据备份）算法

须要硬盘数>=2，数据没有冗余或修复功能，只是多个小容量变成大容量的功能sql

RAID1：磁盘镜像（好处：数据安全、读很快）shell

磁盘的数据镜像到另外一个磁盘上，最大限度的保证系统的可靠性和可修复性数据库

RAID5：分布式奇偶校验磁盘阵列（好处：性价比高，缺点：两块磁盘失效则整个卷的数据都没法恢复，应用：从数据库）django

把数据分散到多个磁盘上，若是任何一个盘数据失效均可以从奇偶校验块中重建centos

RAID10：分片镜像（优势：读写性能良好，相对RAID5重建更简单速度更快，缺点：贵）

对磁盘先作RAID1以后对两组RAID1的磁盘再作RAID0

RAID级别	特色	备份	盘数	读	写
`RAID0`	便宜，读写快，不安全	没有	N	快	快
`RAID1`	贵，高速读，最安全	有	2N	快	慢
`RAID5`	性价比高，读快，安全	有	N+1	快	取决于最慢盘
`RAID10`	贵，高速，安全	有	2N	快	快

2.SAN和NAS

SAN：经过专用高速网将一个或多个网络存储设备和服务器链接起来的专用存储系统

经过光纤链接到服务器，设备经过块接口访问，服务器能够将其当作硬盘使用

NAS：链接在网络上, 具有资料存储功能的装置，以数据为中心，将存储设备与服务器完全分离，集中管理数据，从而释放带宽、提升性能、下降总拥有成本、保护投资。其成本远远低于使用服务器存储，而效率却远远高于后者

使用网络进行链接，经过基于文件协议（NFS、SMB）来访问

PS：网络存储通常都是用来搭建开发环境或者数据库备份

3.QPS和TPS

QPS（Queries Per Second）:每秒钟处理的请求数（通常都是查询，但DML、DDL也包括）

eg：10ms处理1个sql，1s处理100个sql，那么QPS<=100（100ms处理1个sql，QPS<=10）

TPS（Transactions Per Second）:每秒钟系统可以处理的交易或事务的数量（每秒事务数|消息数）

一个事务是指一个客户机向服务器发送请求而后服务器作出反应的过程。客户机在发送请求时开始计时，收到服务器响应后结束计时，以此来计算使用的时间和完成的事务个数

PS：QPS看的多些

1.6.2.常见问题

1.超高的CPU|内存使用率：容易因CPU|内存资源耗尽而宕机

PS：若是是CPU密集型：须要更好的CPU；须要更大的并发量：须要更多的CPU（WEB项目）

MySQL有同一数据中屡次写操做合并为一次写操做

2.并发量大：容易致使数据库链接数被占满

PS：MySQL的max_connections默认是100（根据硬件条件调整）

3.磁盘IO：致使性能直线降低（热点数据内存放不下时）

解决：按期整理磁盘碎片、RAID加强传统硬盘、SSD、Fusion-io（PCIe）、网络存储NAS or ASN

PS：SSD应用于存在大量随机IO或解决单线程IO瓶颈的场景

4.网卡流量（网络）：容易出现没法链接数据库的现象

解决：

减小从服务器的数量

分级缓存（防止同一时间缓存的大量失效）

避免使用select *进行查询（减小传输过程当中的无用字节）

分离业务网络和服务器网络

5.大表定义：单表数据量超过千万行 or 表数据文件超过10G

问题：大表更容易出现慢查询、DDL也很慢也容易致使其余问题
解决：分库分表（拆分为多个小表）
PS：分库分表前能够对大表的历史数据进行归档（冷热数据隔离）【核心：归档时间点的选择】

DDL影响的补充说明：

建索引很慢，并且会引发长时间的主从延迟
修改表结构须要长时间锁表
- 引发长时间的主从延迟
- 影响正常的数据操做

分库分表容易出现的问题：

分表主键的选择
- 不能保证id是全局惟一，这时候可使用诸如雪花算法来解决
跨库跨表的join问题
事物问题（分布式事物诞生了）

PS：不太影响的案例：日志表（insert和select不少，不多delete和update）

6.大事务定义：运行时间较长，操做数据比较多的事物

问题：

锁定太多的数据，形成大量的阻塞和锁超时

回滚须要的时间很长（又得锁一段时间了）

执行时间长，容易致使主从的延迟
解决：

避免一次处理大量数据（分批处理）

去除在事物中没必要要的select语句（通常都是事物中使用过多查询致使的）

PS：select彻底能够在事物外查询，事物专一于写

SQL标准中定义的4种隔离级别：

未提交读（read uncommited）
已提交读（read commited）
- 不可重复读
可重复读（repeatable read）
- innodb的默认隔离级别
可串行化（serializable）
PS：隔离性低到高，并发性高到低

PS：查看事物隔离级别-show variables like '%iso%';，设置会话的隔离级别：set session tx_isolation='read-committed'

扩展：CentOS优化策略（MySQL服务器）

1.内核相关（`/etc/sysctl.conf`）

查看默认值：sysctl -a

tcp相关设置：

# 三次握手listen的最大限制
net.core.somaxconn = 65535 # 默认是128

# 当网络接受速率大于内核处理速率时，容许发送到队列中的包数
net.core.netdev_max_backlog = 65535 # 默认是1000

# Linux队列的最大半链接数（超过则丢包）
net.ipv4.tcp_max_syn_backlog = 65535 # 默认是128（不适合Web服务器）

PS：这边只是一个参考，本身能够根据环境适当下降（最大端口数通常都是65535）

注意：若是是Web服务器，net.ipv4.tcp_max_syn_backlog不宜过大（容易有synflood攻击的安全问题），net.ipv4.tcp_tw_recycle和net.ipv4.tcp_tw_reuse不建议开启

加快tcp连接回收的几个参数：

# TCP等待时间，加快tcp连接回收
net.ipv4.tcp_fin_timeout = 10 # 默认60

# 把发起关闭，但关闭没完成的TCP关闭掉
net.ipv4.tcp_tw_recycle = 1   # 默认0（不适合Web服务器）

# 容许待关闭的socket创建新的tcp
net.ipv4.tcp_tw_reuse = 1     # 默认0（不适合Web服务器）

PS：net.ipv4.tcp_tw_reuse扩展说明：主动调用closed的一方才会在接收到对端的ACK后进入time_wait状态

参考文章：https://blog.csdn.net/weixin_41966991/article/details/81264095

缓存区大小的最大值和默认值：

net.core.wmem_default = 87380 # 默认212992
net.core.wmem_max = 16777216  # 默认212992
net.core.rmem_default = 87380 # 默认212992
net.core.rmem_max = 16777216  # 默认212992

PS：每一个socket都会有一个rmem_default大小的缓存空间（若是设置了setsockopt则就是多少，最大不超过rmem_max）

减小失效链接所占用的系统资源：

# 对于tcp失效连接占用系统资源的优化，加快资源回收效率
# 连接有效时间（单位s）
net.ipv4.tcp_keepalive_time = 120 # 默认7200

# tcp未得到相应时重发间隔（单位s）
net.ipv4.tcp_keepalive_intvl = 30 # 默认75

# 重发数量（单位s）
net.ipv4.tcp_keepalive_probes = 3 # 默认9

内存相关参数：

# 共享单个共享内存下的最大值
kernel.shmmax = 4294967295   # 最大为物理内存-1byte

# 除非虚拟内存所有占满，不然不使用交换分区（为了性能）
# （free -m ==> Swap）
vm.swappiness = 0            # 默认30

PS：kernel.shmmax设置的足够大，通常就是为了容纳整个innodb的缓冲池

eg：4G = 4*1024 M = 4*1024*1024 KB = 4*1024*1024*1024 byte = 4294967296 - 1 = 4294967295
PS：unsigned int => [0, 2^32) => [0,4294967296) => [0,4294967295] 巧不，同样的值

2.资源限制（`/etc/security/limit.conf`）

打开文件数的限制（追加到配置后便可）

# [*|%] [soft|hard] [type_item] [value]
* soft nofile 65536
* hard nofile 65535

默认值：ulimit -a

core file size          (blocks, -c) 0
data seg size           (kbytes, -d) unlimited
scheduling priority             (-e) 0
file size               (blocks, -f) unlimited
pending signals                 (-i) 3548
max locked memory       (kbytes, -l) 64
max memory size         (kbytes, -m) unlimited
open files                      (-n) 1024  《《看这  
pipe size            (512 bytes, -p) 8
POSIX message queues     (bytes, -q) 819200
real-time priority              (-r) 0
stack size              (kbytes, -s) 8192
cpu time               (seconds, -t) unlimited
max user processes              (-u) 3548
virtual memory          (kbytes, -v) unlimited
file locks                      (-x) unlimited

PS：通常来讲是够用了，可是一个遇到大型数据库可能就不够看了（多表多库配置高）

*：全部用户有效、soft：当前系统生效、hard：系统中所能设置的最大值、nofile：所限制的资源是打开文件的最大数、65536：数值【重启才生效】

3.磁盘调度策略（`/sys/block/devname/queue/scheduler`）

如今默认策略就是deadline，因此不用优化了【对数据库支持很不错】

PS：经过cat /sys/block/sda/queue/scheduler查看（[这个就是设置的值]）

noop [deadline] cfq

若是不是能够经过：echo deadline > /sys/block/sda/queue/scheduler来设置

cfq：会在队列中插入一些没必要要的请求，会致使相应时间加长，通常桌面系统用的比较多

noop：实现了一个FIFO队列，像电梯工做同样对IO请求进行组织，当有一个新请求到来时会合并到最近请求以后，以此保证请求同一介质（倾向于饿死读而利于写）通常闪存设备、RAM、嵌入式系统用的比较多

deadline：确保了在一个截止时间内去服务请求（可调整）默认读期限短于写期限（防止写操做由于不能被读而出现饿死的现象）

4.文件系统

Win：NTFS，Linux：EXT3|四、XFS

Linux如今基本上都是选择XFS，若是是EXT3、EXT4还须要设置一下：/etc/fstab（慎重）

/dev/sda1/ext4 noatime,nodiratime,data=writeback 1 1

PS：noatime表示不记录访问时间，nodiratime不记录目录的访问时间（能够减小一些写的操做）

不一样的日志策略：data=[wtiteback|ordered|journal]

writeback：只有原数据写入日志，原数据写入和数据写入并非同步的（最快）PS：Innodb有本身的事务日志，因此是最好的选择

ordered：只会记录原数据，但提供了一些一致性的保证，在写原数据以前会先写数据，使他们保持一致（比writeback慢但更安全）

journal：提供了原子日志的一种行为，在数据写入到最终位置以前，将记录到日志中（最慢，对Innodb来讲是没有必要）

课后拓展：

TPS、并发用户数、吞吐量关系
https://www.cnblogs.com/zhengah/p/4532156.html

针对Mysql所在linux服务器的系统优化参数
https://blog.csdn.net/qq_40999403/article/details/80666102

网络优化之net.ipv4.tcp_tw_recycle参数
https://blog.csdn.net/chengm8/article/details/51668992

linux socket 缓存: core rmem_default rmem_max
https://blog.csdn.net/penzchan/article/details/41682411

Linux上的free命令详解、swap机制
http://www.cnblogs.com/xiaojianblogs/p/6254535.html

磁盘IO太高时的处理办法
https://www.cnblogs.com/wjoyxt/p/4808024.html

文件系统对性能的影响
https://blog.csdn.net/qq_30353203/article/details/78197870

1.6.3.MySQL配置参数

建议：优先从数据库设计和SQL优化着手，而后才是配置优化和存储引擎的选择，最后才是硬件提高

设计案例：列太多不行，关联太多也不行（10个之内），不恰当的分区表，使用了外键

分区表：一个服务器下，逻辑上仍是一个表，物理存储上分红了多个表（相似于SQLServer的水平分库）

PS：分库分表：物理和逻辑上都拆分红多个表了

以前讲环境的时候简单说了下最基础的

[mysqld]
# 独立表空间: 每个表都有一个.frm表描述文件，还有一个.ibd文件
innodb_file_per_table=on
# 不对链接进行DNS解析(省时)
skip_name_resolve=on
# 配置sql_mode
sql_mode='strict_trans_tables'

而后说SQL_Mode的时候简单说了下全局参数和会话参数的设置方法：MySQL的SQL_Mode修改小计

全局参数设置：set global 参数名=参数值;
- 只对新会话有效，重启后失效
会话参数设置：set [session] 参数名=参数值
- 只对当前会话有效，其余会话不影响

这边继续说下其余几个影响较大的配置参数：（对于开发人员来讲，简单了解便可，这个是DBA的事情了）

1.安全相关配置

expire_logs_days：自动清理binlog
- PS：通常最少保存7天（具体根据业务来）
max_allowed_packet：配置MySQL接收包的大小
- PS：默认过小。若是配置了主从，须要配置成同样大（防止丢包）
skip_name_resolve：禁用DNS查找（这个咱们以前说过了，主要是提速）
- PS：若是启用了，那么进行用户受权时，只能经过ip或者ip段或者本机host出现过的域名进行受权
  - 用*的是没影响的
sysdata_is_now：保证sysdate()返回肯定性日期
- PS：若是主从使用了binlog的statement模式，sysdata的结果会不同，最后致使数据不一致
  - 相似的问题还有不少，eg：获取最后一次id的时候（last_insert_id()）
  - 扩：如今MySQL有了Mixed模式
read_only：通常用户只能读数据，只有root用户能够写：
- PS：推荐在从库中开启，这样就只接受从主库中的写操做，其它只读
- 从库受权的时候不要授予超级管理员的权限，否则这个参数至关于废了
skip_slave_start：禁用从库(Slave)自动恢复
- MySQL在重启后会自动启用复制，这个能够禁止
- PS：不安全的崩溃后，复制过去的数据可能也是不安全的（手动启动更合适）
sql_mode：设置MySQL的SQL模式（这个上次说过，默认是宽松的检测，这边再补充几个）
- strict_trans_tables：对全部支持事物类型的表作严格约束：
  - 最多见，主要对事物型的存储引擎生效，其余的没效果
  - PS：若是插入数据不符合规范，则中断当前操做
- no_engine_subtitution：建表的时候指定不可用存储引擎会报错
- only_full_group_by：检验group by语句的合法性
  - 要求在在分组查询语句中，把全部没有使用聚合函数的列，列出来
  - eg：select count(url),name from file_records group by url;
    - 使用了name字段，name不是聚合函数，那必须在group by中写一下
- ansi_quotes：不容许使用双引号来包含字符串
  - PS：防止数据库迁移的时候出错
- PS：生存环境下最好不要修改，容易报错对业务产生影响（严格变宽松没事）

PS：通常SQL_Mode是测试环境相对严格（strict_trans_tables,only_full_group_by,no_engine_subtitution,ansi_quotes），线上相对宽松（strict_trans_tables）

补充说下sysdate()和now()的区别:（看个案例就懂了）

PS：对于一个语句中调用多个函数中now()返回的值是执行时刻的时间，而sysdate()返回的是调用该函数的时间

MariaDB [(none)]> select sysdate(),sleep(2),sysdate();
+---------------------+----------+---------------------+
| sysdate()        | sleep(2) | sysdate()        |
+---------------------+----------+---------------------+
| 2019-03-28 09:09:29 |     0 | 2019-03-28 09:09:31  |
+---------------------+----------+---------------------+
1 row in set (2.001 sec)

MariaDB [(none)]> select now(),sleep(2),now();
+---------------------+----------+---------------------+
| now()           | sleep(2) | now()          |
+---------------------+----------+---------------------+
| 2019-03-28 09:09:33 |     0 | 2019-03-28 09:09:33  |
+---------------------+----------+---------------------+
1 row in set (2.000 sec)

2.内存相关

sort_buffer_size：每一个会话使用的排序缓冲区大小
- PS：每一个链接都分配这么多eg：1M，100个链接==>100M（默认是所有）
join_buffer_size：每一个会话使用的表链接缓冲区大小
- PS：给每一个join的表都分配这么大，eg：1M，join了10个表==>10M
binlog_cache_size：每一个会话未提交事物的缓冲区大小
read_rnd_buffer_size：设置索引缓冲区大小
read_buffer_size：对MyISAM全表扫描时缓冲池大小（通常都是4k的倍数）
- PS：对临时表操做的时候可能会用到

read_buffer_size的扩充说明：

如今基本上都是Innodb存储引擎了，大部分的MyISAM的配置就不用管了，可是这个仍是须要配置下的

引入下临时表知识扩展：

系统使用临时表：
- 不超过16M：系统会使用Memory表
- 超过限制：使用MyISAM表
本身建的临时表：（可使用任意存储引擎）
- create temporary table tb_name(列名类型类型修饰符,...)

PS：如今知道为啥配置read_buffer_size了吧（系统使用临时表的时候，可能会使用MyISAM）

3.IO相关参数

主要看看Innodb的IO相关配置

事物日志：（总大小:Innodb_log_file_size * Innodb_log_files_in_group）

事物日志大小：Innodb_log_file_size
事物日志个数：Innodb_log_files_in_group

日志缓冲区大小：Innodb_log_buffer_size

通常日志先写到缓冲区中，再刷新到磁盘（通常32M~128M就够了）

知识扩展：redo Log内存中缓冲区的大小：(字节为单位)

show variables like 'innodb_log_buffer_size';
- PS：以字节为单位，每隔1s就会把数据存储到磁盘上
show variables like 'innodb_log_files_in_group';
- PS：有几个就产生几个ib_logfile文件（默认是2）

日志刷新频率：Innodb_flush_log_at_trx_commit

0：每秒进行一第二天志写入缓存，并刷新日志到磁盘（最多丢失1s）
1：每次交执事物就把日志写入缓存，并刷新日志到磁盘（默认）
2：每次事物提交就把日志写入缓存，每秒刷新日志到磁盘（推荐）

刷新方式：Innodb_flush_method=O_DIRECT

关闭操做系统缓存（避免了操做系统和Innodb双重缓存）

如何使用表空间：Innodb_file_per_table=1

为每一个innodb创建一个单独的表空间（这个基本上已经成为通用配置了）

是否使用双写缓存：Innodb_doublewrite=1（避免发生页数据损坏）

默认是开启的，若是出现写瓶颈或者不在乎一些数据丢失能够不开启（开启后性能↑↑）
查看是否开启：show variables like '%double%';

设置innodb缓冲池大小：innodb_buffer_pool_size

若是都是innodb存储引擎，这个参数的设置能够这样来算：（通常都是内存的75%）
查看命令：show global variables like 'innodb_buffer_pool_size';
PS：缓存数据和索引（直接决定了innodb性能） 课后拓展：http://www.noobyard.com/article/p-pcjvwfdx-k.html

innodb缓存池实例的个数：innodb_buffer_pool_instances

PS：主要目的为了减小资源锁增长并发。每一个实例的大小=总大小/实例的个数
通常来讲，每一个实例大小不能小于1G，并且个数不超过8个

4.其余服务器参数

sync_binlog：控制MySQL如何像磁盘中刷新binlog
- 默认是0，MySQL不会主动把缓存存储到磁盘，而是靠操做系统
- PS：为了数据安全，建议主库设置为1（效率也容易下降）
  - 仍是那句话：通常不去管，具体看业务
控制内存临时表大小：tmp_table_size and max_heap_table_size
- PS：建议保持两个参数一致
max_connections：设置最大链接数
- 默认是100，能够根据环境调节，太大可能会致使内存溢出
Sleep等待时间：通常设置为相同值（经过链接参数区分是不是交互链接）
- interactive_timeout：设置交互链接的timeout时间
- wait_timeout：设置非交互链接的timeout时间

扩展工具：`pt-config-diff`

使用参考：pt-config-diff u=root,p=pass,h=localhost /etc/my.conf

eg：比较配置文件和服务器配置

pt-config-diff /etc/my.cnf  h=localhost --user=root --password=pass
3 config differences
Variable                  /etc/my.cnf mariadb2
========================= =========== ========
max_connect_errors        2           100
rpl_semi_sync_master_e... 1           OFF
server_id                 101         102

课后拓展：https://www.cndba.cn/leo1990/article/2789

扩展：常见存储引擎

常见存储引擎：

MyISAM：不支持事物，表级锁
- 索引存储在内存中，数据放入磁盘
- 文件后缀：frm、MYD、MYI
Innodb：事物级存储引擎，支持行级锁和事物ACID特性
- 同时在内存中缓存索引和数据
- 文件后缀：frm、ibd
Memory：表结构保存在磁盘文件中，表内容存储在内存中
- Hash索引、B-Tree索引
- PS：容易丢失数据（重启后数据丢失，表结构依旧存在）
CSV：通常都是做为中间表
- 以文本方式存储在文件中，不适合大表
- frm（表结构）、CSV（表内容）、CSM（元数据，eg：表状态、数据量）
- PS：不支持索引（engine=csv），全部列不能为Null
- 详细能够查看上次写的文章：小计：协同办公衍生出的需求
Archive：数据归档（压缩）
- 文件：.frm(存储表结构)、.arz(存储数据)
- 只支持insert和select操做
- 只容许在自增ID列上加上索引
- 适合场景：日志类（省空间）
Federated：创建远程链接表（性能不怎样，默认禁止）
- 本地不存储数据（数据所有在远程服务器上）
- 本地须要保存表结构和远程服务器的链接信息
- PS：相似于SQLServer的连接服务器

逆天点评：除非你有100%的理由，不然全选innodb，特别不建议混合使用

Memory存储引擎

Memory存储引擎：

支持Hash和BTree两种索引
- Hash索引：等值查找（默认）
- Btree索引：范围查找
  - create index ix_name using btree on tb_name(字段,...)
- PS：不一样场景下的不一样选择，性能差别很大
全部字段类型都等同于固定长度，且不支持Text和Blog等大字段类型
- eg：varchar(100)==等价于==> char(100)
存储引擎使用表级锁
- PS：性能不见得比innodb好
大小由max_heap_table_size决定（默认16M）
- PS：若是想存大点，就得改参数（对已经存在的表不生效，须要重建才行）
经常使用场景（数据易丢失，要保证数据可再生）
- 缓存周期性聚合数据的结果
- 用于查找或者映射的表（eg：邮编和地区的对应表）
- 保存数据分析中产生的中间表

PS：如今基本上都是redis了，若是不使用redis的小项目能够考虑（eg：官网、博客...）

文章拓展：

OLAP、OLTP的介绍和比较
https://www.cnblogs.com/hhandbibi/p/7118740.html

now()与sysdate()
http://blog.itpub.net/22664653/viewspace-752576/
https://stackoverflow.com/questions/24137752/difference-between-now-sysdate-current-date-in-mysql

binlog三种模式的区别（row，statement，mixed）
https://blog.csdn.net/keda8997110/article/details/50895171/

MySQL-重作日志 redo log -原理
https://www.cnblogs.com/cuisi/p/6525077.html

详细分析MySQL事务日志(redo log和undo log)
https://www.cnblogs.com/f-ck-need-u/archive/2018/05/08/9010872.html

innodb_flush_method的性能差别与File I/O
https://blog.csdn.net/melody_mr/article/details/48626685

InnoDB关键特性之double write
https://www.cnblogs.com/geaozhang/p/7241744.html

存储引擎的扩展

1.简单回顾

上节在最后的时候说了下存储引擎，这边简单回顾下：

存储引擎	是否支持事物	文字说明
`MyISAM`	不支持	MySQL5.6之前的默认存储引擎
`CSV`	不支持	用CSV格式来存储数据（通常当中间表）
`Archive`	不支持	只能查询和添加数据（通常记录日志用）
`Memory`	不支持	数据只存储在内存中（容易丢失）
`innodb`	支持（行级锁）	如今基本上都使用这个
`NDB`	支持（行级锁）	MySQL集群才使用（内存型，数据会持久化一份）

补充说明：

Archive存储引擎的数据会用zlib来压缩，并且只支持在自增ID上添加索引
NDB存储引擎的数据存储在磁盘中（热数据存储在内存中），支持Ttree索引和集群
- 场景：数据须要彻底同步（这些后面会继续说的）

2.常见场景

提一个场景：innodb表没法在线修改表结构的时候怎么解决？

先看下Innodb不支持在线修改表结构都有哪些状况：（主要从性能方面考虑）

第一次建立全文索引和添加空间索引（MySQL5.6之前版本不支持）
- 全文索引：create fulltext index name on table(列,...);
- 空间索引：alter table geom add spatial index(g);
删除主键或者添加自增列
- PS：innodb存储就是按照主键进行顺序存储的（这时候须要从新排序）
- 删除主键：alter table 表名 drop primary key
- 加自增列：alter table 表名 add column id int auto_increment primary key
修改列类型、修改表字符集
- 修改列类型：alter table 表名 modify 列名类型类型修饰符
- 修改字符集：alter table 表名 character set=utf8mb4

PS：DDL不能并发执行（表级锁）长时间的DDL操做会致使主从不一致

DDL无法进行资源限制，表数据多了容易占用大量存储IO空间（空间不够就容易执行失败）

3.解决方案

安装：yum install percona-toolkit or apt-get install percona-toolkit

PS：离线包：https://www.percona.com/downloads/percona-toolkit/LATEST/

命令：pt-online-schema-change 选项 D=数据库,t=表名,u=用户名,p=密码

原理：先建立一个类型修改完的表，而后把旧表数据copy过去，而后删除旧表并重命名新表

查看帮助文档：pt-online-schema-change --help | more

官方文档：https://www.percona.com/doc/percona-toolkit/LATEST/pt-online-schema-change.html

PS：通常就--alter和--charset用的比较多（--execute表明执行）

经常使用：pt-online-schema-change --alter "DDL语句" --execute D=数据库,t=表名,u=用户名,p=密码

eg：添加新列：pt-online-schema-change --alter "add 列名类型" --execute D=数据库,t=表名,u=用户名,p=密码

知识回顾：

添加字段：add
- alter table tb_name add 列名数据类型修饰符 [first | after 列名];
- PS：SQLServer没有[first | after 列名]
修改字段：alter、change、modify
- 修改字段名：alter table tb_name change 旧列名新列名类型类型修饰符
- 修改字段类型：alter table tb_name modify 列名类型类型修饰符
- 添加默认值：alter table tb_name alter 列名 set default df_value
删除字段：drop
- alter table tb_name drop 字段名

4.InnoDB专栏

写在前面的概念：排它锁（别名：独占锁、写锁）、共享锁（别名：读锁）

4.1.innoDB是如何实现事物的？

事物4大特性：A（原子性）C（一致性）I（隔离性）D（持久性）

innodb事务日志主要就是redo log（重作日志）和undo log（回滚日志）

事物特性	innodb实现方式
原子性(A)	回滚日志(`undo log`)：用于记录数据修改前的状态
一致性(C)	重作日志(`redo log`)：用于记录数据修改后的状态
隔离性(I)	锁(`lock`)：用于资源隔离（共享锁 + 排他锁）
持久性(D)	重作日志(`redo log`) + 回滚日志(`undo log`)

我画个转帐案例：

4.2.innodb`读`操做是否会阻塞`写`操做？

通常状况下：查询须要对资源添加共享锁（读锁） | 修改须要对资源添加排它锁（写锁）

是否兼容	`写锁`	`读锁`
`写锁`	不兼容	不兼容
`读锁`	不兼容	兼容

PS：共享锁和共享锁之间是能够共存的（读的多并发）理论上讲读操做和写操做应该相互阻塞

而innodb看起来却仿佛打破了这个常规，看个案例：

1.启动一个事物，可是不提交

2.在另外一个链接中查询

PS：理论上独占锁没提交时是不能读操做的，但innodb作了优化，会查询undo log（未修改前的数据）中的记录来提升并发性

3.提交事物后再查询，这时候就看到更新后的数据了

PS：这个就是innodb的MVCC（多版本并发控制）

知识拓展：

【推荐】Mysql的InnoDB事务多版本并发控制如何实现（MVCC）

https://www.cnblogs.com/aspirant/p/6920987.html

https://blog.csdn.net/u013007900/article/details/78641913

https://www.cnblogs.com/dongqingswt/p/3460440.html

https://www.jianshu.com/p/a3d49f7507ff

https://www.jianshu.com/p/a03e15e82121

https://www.jianshu.com/p/5a9c1e487ddd

基于mysql全文索引的深刻理解
https://www.cnblogs.com/dreamworlds/p/5462018.html

【推荐】MySQL中的全文索引(InnoDB存储引擎)
https://www.jianshu.com/p/645402711dac

innodb的存储结构
https://www.cnblogs.com/janehoo/p/6202240.html

深刻浅出空间索引：为何须要空间索引
https://www.cnblogs.com/mafeng/p/7909426.html

常见的空间索引方法
https://blog.csdn.net/Amesteur/article/details/80392679

【推荐】pt-online-schema-change解读
https://www.cnblogs.com/xiaoyanger/p/6043986.html

pt-online-schema-change使用说明、限制与比较
https://www.cnblogs.com/erisen/p/5971416.html

pt-online-schema-change使用注意要点
https://www.jianshu.com/p/84af8b8f040b

详细分析MySQL事务日志(redo log和undo log)
https://www.cnblogs.com/f-ck-need-u/archive/2018/05/08/9010872.html

1.6.4.MySQL权限相关

1.帐号权限设置

以前在SQL环境篇的时候简单提了一下权限设置（点我回顾），如今再说说经常使用的权限知识：

http://www.noobyard.com/article/p-ywtyxuzh-dw.html

1.2.建立帐号

用户组成格式：用户名@可访问控制的列表

用户名：通常16字节
- 以UTF-8为例：1英文字符 = 1字节，1中文 = 3字节
可访问控制列表：
- %：全部ip均可访问（通常都这么干的，数据比较重要的推荐使用第二种）
- 192.168.1.%：192.168.1网段的ip均可以访问
  - 这个不包含localhost（数据库本地服务器不能访问）
- localhost：只能经过数据库服务器进行本地访问

1.建立命令：create user 用户名@ip identified by '密码';

PS：可使用\h create user来查看帮助文档

2.查看当前用户：select user();

PS：MariaDB查看当前数据库有哪些用户：select user,password,host from mysql.user;

MySQL：select user,authentication_string,host from mysql.user;

3.修改密码：alter user user() identified by '密码';

4.另类思路：我通常都是直接在表中插入数据（MySQL是authentication_string）

eg：insert into mysql.user(user,host,password) values("用户名","%",password("密码"));

PS：修改密码：update mysql.user setpassword=password('新密码') where user='用户名';

知识拓展：ERROR 1045 (28000): Access denied for user 'mysql'@'localhost'

1.3.经常使用权限

权限类别	语句	说明文字
`admin`	`create user`	建立新用户权限
-	`grant option`	为用户设置权限
-	`super`	设置服务器权限
`DDL`	`create`	建立数据库和表
-	`alter`	修改表结构权限
-	`index`	建立和删除索引
-	`drop`	删除数据库和表
`DML`	`select`	查询表数据权限
-	`insert`	插入表数据权限
-	`update`	删除表数据权限
-	`execute`	可执行存储过程
-	`delete`	删除表数据权限

补充说明：super：如设置全局变量等系统语句，通常DBA会有这个权限

PS：MariaDB查看数据库支持哪些权限：show privileges;

https://mariadb.com/kb/en/library/show-privileges/

1.4.用户受权

权限这个东西你们都懂，通常都是最小权限

受权命令以下：grant 权限列表 on 数据库.表 to 用户名@ip

PS：开发的时候可能为了省事这么设置：grant all [privileges] on 数据库.* to 用户名@'%';

正规点通常这么设置：

线上：grant select,insert,update on 数据库.* to 用户名@ip
开发：grant select,insert,update,index,alter,create on 数据库.* to 用户名@ip段

PS：查看当前用户权限：show grants for 用户名;，刷新数据库权限：flush privileges;

之前能够在受权的时候直接建立用户（加一段identified by '密码'），新版本好像分开了

1.5.权限收回

命令以下：revoke 权限列表 on 数据库.表 from 用户名@ip

eg：revoke create,alter,delete from django.* from dnt@'%'（是from而不是on）

2.数据库帐号安全

这个了解便可，我也是刚从DBA朋友那边了解到的知识（MySQL8.0），基本上用不到的，简单罗列下规范：

只给最小的权限（线上权限基本上都是给最低的(防黑客)）
密码强度限制（MySQL高版本默认有限制，主要针对MariaDB）
密码有期限（谨慎使用，不推荐线上用户设置有效期）
历史密码不可用（不能重复使用旧密码）
- PS：如今用BAT的产品来修改密码基本上都是不让使用上次的密码

设置前三次使用过的密码不能再使用：create user@'%'identified by '密码' password history 3;

PS：设置用户密码过时：alter user 用户名@ip password expire;

3.迁移问题

经典问题：如何从一个实例迁移数据库帐号到另外一个实例？

eg：老集群 > 新集群

官方文档：https://www.percona.com/doc/percona-toolkit/LATEST/pt-show-grants.html

3.1.版本相同

数据库备份下，而后在新环境中恢复

而后导出用户建立和受权语句：eg：pt-show-grants -u=root,-p=密码,-h=服务器地址 -P=3306

扩展文章：pt-show-grants的使用（eg：pt-show-grants --host=192.168.36.123 --port=3306 --user=root --password=密码）

生成的脚本大体是这样的：(把脚本放新服务器中执行便可)

CREATE USER IF NOT EXISTS 'mysql.sys'@'localhost';
ALTER USER 'mysql.sys'@'localhost' IDENTIFIED WITH 'mysql_native_password' AS '*THISISNOTAVALIDPASSWORDTHATCANBEUSEDHERE' REQUIRE NONE 
PASSWORD EXPIRE DEFAULT ACCOUNT LOCK;GRANT SELECT ON `sys`.`sys_config` TO 'mysql.sys'@'localhost';
GRANT TRIGGER ON `sys`.* TO 'mysql.sys'@'localhost';
GRANT USAGE ON *.* TO 'mysql.sys'@'localhost';
-- Grants for 'root'@'%'
CREATE USER IF NOT EXISTS 'root'@'%';
ALTER USER 'root'@'%' IDENTIFIED WITH 'mysql_native_password' AS '*6BB4837EB74329105EE4568DDA7DC67ED2CA2AD9' REQUIRE NONE PASSWORD EXPI
RE DEFAULT ACCOUNT UNLOCK;GRANT ALL PRIVILEGES ON *.* TO 'root'@'%' WITH GRANT OPTION;

3.2.版本不一样

可使用上面的方法，可是须要使用mysql_upgrade升级下系统表（适用：低版本到高版本）可是推荐使用生成SQL脚本

扩展文章：mysql升级小结和mysql_upgrade的用途