咱们都知道Sql(Structured Query Language),翻译过来就是结构化查询语言,经常使用的Sql database有mysql、oracle、sqlserver等等,那NoSql是什么呢? NoSql在维基上面的解释是,"non SQL" or "non relational",翻译过来就是非SQL或非关系,咱们一般的解释是Not only sql,不只仅是SQL,咱们从相关联的地方来逐步掰扯掰扯。mysql
结构化与no 结构化git
结构化数据:
行数据,存储在二维表(关系型数据库),能够用结构来逻辑表达实现的数据。非结构化数据:
不方便用数据库二维逻辑表来表现的数据即称为非结构化数据,包括全部格式的办公文档、文本、图片、XML、图像、音频、视频等。半结构化数据:
介于二者之间,JSON、HTML文档就属于半结构化数据,自描述、数据的结构和内容混在一块儿,没有明显区分。先看看数据模型,结构化:二维表(关系型),非结构化:无,半结构化:树,图。github
设计角度
SQL遵循ACID原则
A:原子性(Atomicity)
C:一致性(Consistency)
I:隔离性(Isolation)
D:持久性(Durabilityweb
数据库设计:3NF
一:确保每列保持原子性
二:确保表中的每列都和主键相关
三:确保每列都和主键直接相关而不是间接相关算法
NoSQL遵循CAP理论,布式系统只能知足其中两项
C:一致性(Consistency)(全部节点在同一时间具备相同的数据)
A:可用性(Availability)(保证每一个请求无论成功或者失败都有响应)
P:分区容错性(Partition tolerance)(系统中任意信息的丢失或失败不会影响系统的继续运做)sql
使用BASE模型
Basically Available:基本可用
Soft State:软状态,能够一段时间内状态不一样步
Eventually consistent:最终一致性数据库
优缺点
优势
关系型数据库:事务机制和高效的查询机制
非关系型数据库:灵活的可扩展性,灵活的数据模型,与云计算紧密融合。缓存
缺点
关系型数据库:web2.0时代,海量数据的管理需求,数据高并发的需求,高可扩展性和高可用性的需求都很难知足。网络
非关系型数据库:复杂的查询和事务,还有不如关系型成熟数据结构
解决办法
没有一个模式可以适用于大相径庭的业务场景
关系模型做为统一的数据模型即被用于数据分析,也被用于在线业务,但这二者一个强调高吞吐,一个强调低延时,已经演化出彻底不一样的架构。
Hadoop就是针对数据分析,MongoDB、Redis等就是针对在线业务,二者都抛弃了关系模型。因此在设计的时候要根据业务的实际场景来划分不一样的数据区域,作不一样的数据处理。
NoSQL四大类型
键值数据库:
例:Redis、SimpleDB、Memcached,键值对模式,涉及频繁读写,拥有简单数据模型的应用,内容缓存,好比会话、配置文件、参数、购物车等,扩展性好、灵活、大量写操做时性能高,没法存储结构化信息,条件查询效率低,不支持事务,某些键值数据库中产生故障时,不可用回滚。
列族数据库:
例:BigTable、Hbase、HadoopDB,列族模式,分布式数据库存储和管理、数据分布于多个数据中心的应用,能够容忍副本中存在短时间不一致状况的应用,拥有动态字段的应用,拥有潜在大量数据的应用,查找速度快、可扩展性强,容易进行分布式扩展,复杂性低,功能较少,大都不支持强事务一致性。
文档数据库:
例:MongoDB、CouchDB,键值是版本化的文档,存储、索引并管理面向文档的数据或者相似的半结构化数据,用于后台具备大量读写操做的网站,使用JSON数据结构的应用,使用嵌套结构等非规范化数据的应用程序,性能较好(高并发),灵活高,复杂低,数据结构灵活,能够将常常查询的数据存储同一个文档中,既能够根据键来构建索引,也能够根据值(内容)构建索引。像XML文档、HTML文档、JSON文档都可以对包含的数据类型和内容进行“自我描述”。缺点是缺少统一的查询语法,文档数据库不支持文档间的事务。
图形数据库:
例:Neo4J,图结构模式,专门用于处理具备高度相互关联关系的数据,比较适合于社交网络、模式识别、依赖分析、推荐系统已经路径寻找等问题,灵活性高,支持复杂回形算法,可用于构建复杂的关系图谱,复杂性高,只能支持必定的数据规模。
附上对比图
比较标准 | RDBMS | NoSQL | 备注 |
---|---|---|---|
数据库原理 | 彻底支持 | 部分支持 | RDBMS有关系代数理论做为基础,NOSQL没有统一的理论基础 |
数据规模 | 大 | 超大 | RDBMS很难横向扩展,纵向扩展的空间有限,性能随规模增大而下降,NOSQL容易实现增长设备支持 |
数据库模式 | 固定 | 灵活 | RDBMS定义数据库模式严格遵照约束条件,NOSQL不存在数据库模式 |
查询效率 | 快 | 弱 | RDBMS借助索引机制能够实现快速查询,NOSQL没有复制查询的索引,不具有高度结构化查询特性 |
一致性 | 强 | 弱 | RDBMS遵循ACID原则,NOSQL放松事务要求,遵循BASE模型只能保证最终一致性 |
数据完整性 | 容易 | 很难 | RDBMS经过主键或者非空约束、外键等来实现,NOSQL没法实现 |
扩展性 | 通常 | 好 | 参考数据规模 |
可用性 | 好 | 很好 | RDBMS在任什么时候候均可以保证数据一致性为优先目标、其次才是优化系统性能,随数据量增大为保证一致性只能提供较弱的可用性,NOSQL能提供较高的可用性 |
标准化 | 是 | 否 | RDBMS已经标准化(SQL),NOSQL没有统一查询语言,没有行业标准 |
技术支持 | 高 | 低 | RDBMS成熟,NOSQL起步 |
可维护性 | 复杂 | 复杂 |
对NoSQL兴趣的话推荐另一篇文章,是关于Hbase的。
浅谈Hbase与中间的一些设计策略
我的博客~
简书~