MySQL架构与SQL执行流程

时间 2020-12-27 标签 MySQL

MySQL架构设计

下面是一张MySQL的架构图：

上方各个组件的含义如下：

Connectors

指的是不同语言中与SQL的交互

Management Serveices & Utilities：

系统管理和控制工具

Connection Pool：连接池

管理缓冲用户连接，线程处理等需要缓存的需求。
负责监听对 MySQL Server 的各种请求，接收连接请求，转发所有连接请求到线程管理模块。每一个连接上 MySQL Server 的客户端请求都会被分配（或创建）一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信，
接受客户端的命令请求，传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建，线程的 cache 等

SQL Interface：SQL接口

接受用户的SQL命令，并且返回用户需要查询的结果。比如select from就是调用SQL Interface

Parser：命令解析器

SQL命令传递到解析器的时候会被解析器验证和解析。解析器是由Lex和YACC实现的，是一个很长的脚本。
在 MySQL中我们习惯将所有 Client 端发送给 Server 端的命令都称为 query ，在 MySQL Server 里面，连接线程接收到客户端的一个 Query 后，会直接将该 query 传递给专门负责将各种 Query 进行分类然后转发给各个对应的处理模块。
主要功能：
a . 将SQL语句进行语义和语法的分析，分解成数据结构，然后按照不同的操作类型进行分类，然后做出针对性的转发到后续步骤，以后SQL语句的传递和处理就是基于这个结构的。
b. 如果在分解构成中遇到错误，那么就说明这个sql语句是不合理的

Optimizer: 查询优化器

SQL语句在查询之前会使用查询优化器对查询进行优化。就是优化客户端请求的 query（sql语句），根据客户端请求的 query 语句，和数据库中的一些统计信息，在一系列算法的基础上进行分析，得出一个最优的策略，告诉后面的程序如何取得这个 query 语句的结果
他使用的是“选取-投影-联接”策略进行查询。
用一个例子就可以理解：

1	select uid,name from user where gender = 1;

这个select 查询先根据where 语句进行选取，而不是先将表全部查询出来以后再进行gender过滤
这个select查询先根据uid和name进行属性投影，而不是将属性全部取出以后再进行过滤
将这两个查询条件联接起来生成最终查询结果

Cache和Buffer：查询缓存。

他的主要功能是将客户端提交给MySQL 的 Select 类 query 请求的返回结果集 cache 到内存中，与该 query 的一个 hash 值做
一个对应。该 Query 所取数据的基表发生任何数据的变化之后， MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中， Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的
如果查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存，记录缓存，key缓存，权限缓存等
存储引擎接口
存储引擎接口模块可以说是 MySQL 数据库中最有特色的一点了。目前各种数据库产品中，基本上只有 MySQL 可以实现其底层数据存储引擎的插件式管理。这个模块实际上只是一个抽象类，但正是因为它成功地将各种数据处理高度抽象化，才成就了今天 MySQL 可插拔存储引擎的特色。
注意：存储引擎是基于表的，而不是数据库。

SQL语句执行流程

连接

客户端发来一条SQL语句，监听客户端的‘连接管理模块’接收请求
将请求转发到‘连接进/线程模块’
调用‘用户模块’来进行授权检查
通过检查后，‘连接进/线程模块’从‘线程连接池’中取出空闲的被缓存的连接线程和客户端请求对接，如果失败则创建一个新的连接请求

处理

如果是查询语句则先查询缓存，检查语句是否完全匹配，接着再检查是否具有权限，都成功则直接取数据返回
上一步有失败则转交给‘命令解析器’，经过词法分析，语法分析后生成解析树
接下来是预处理阶段，处理解析器无法解决的语义，检查权限等，生成新的解析树
再转交给对应的模块处理
如果是查询还会经由‘查询优化器’做大量的优化，生成执行计划
模块收到请求后，通过‘访问控制模块’检查所连接的用户是否有访问目标表和目标字段的权限
有则调用‘表管理模块’，先是查看table cache中是否存在，有则直接对应的表和获取锁，否则重新打开表文件
根据表的meta数据，获取表的存储引擎类型等信息，通过接口调用对应的存储引擎处理
上述过程中产生数据变化的时候，若打开日志功能，则会记录到相应二进制日志文件中

结果

SQL执行完成后，将结果集返回给‘连接进/线程模块’
返回的也可以是相应的状态标识，如成功或失败等
连接进/线程模块’进行后续的清理工作，并继续等待请求或断开与客户端的连接