oracle表链接方式

时间 2019-11-10 标签 oracle 表链接方式

在作表join的时候， Oracle有三种方式，与其说有三种方式，不如说是三种策略。 sql

分别是： oracle

sort merge join(SMJ)
nest loop(NL)
hash join(HJ)

根据个人理解来说讲这三种策略。 oop

首先讲讲Row Source, 根据Oracle官方的解释，性能

Row source is a row set returned by a step in the execution plan along with a control structure that can iteratively process the rows. The row source can be a table, a view or result of a join or grouping operation. spa

总之， Row source是oracle根据执行计划生成的可操做数据集, 这种说法比Table更为严谨，由于join的两侧多是view或者其余的object. code

1) sort merge join. 排序

例如: 索引

select * from t1 inner join t2 on t1.id=t2.id 内存

首先会把row source1(t1)先载入内存，进行排序，而后把row source2(t2)载入内存，进行排序，而后进行merge操做。资源

什么是merge 操做？就是将两边的行按照链接条件连起来， (t1.id=t2.id)。

不难看出，这种方式将须要链接的两张表中的列都放到内存中，而后进行排序，而排序是一个消耗资源的操做，这样对于两张比较大的表，性能恐怕会比较差。

因此，这种策略适合于表比较小，或者在链接列上有索引的表。由于索引列已经排过序了。

2) Nested loops

选定一张表作为驱动表，Oracle会遍历驱动表中的每一行，根据链接条件去匹配第二张表中的行。

好比第一张表中有50行数据，第二张表中有100行数据，这样遍历的时间约等于50*100+50*磁头切换时间

若是选择第二张表做为驱动表，遍历时间约等于100*50+100*磁头切换时间。

可见使用小表做为驱动表能够减小I/O，性能会比较好。

例如:

select from t1 inner join t2 on t1.id=t2.id

以上的这个hint 表明的是按照sql中指定的表顺序进行链接。也就是我把t1做为驱动表(Driving table).

Orace会根据t1中的每一行，去寻找t2中知足t1.id=t2.id的行，而后返回到结果集。

不难看出，若是在内部表的查询列上有索引的话，查询的效率将提高。

听说，对于可并行执行的大表，使用分区了的大表做为Driving table，性能会比较好，由于会在每一个分区上并行执行，可是取决于硬件是否支持多个磁盘，多个CPU并行执行，这个我并无试过，因此不敢妄加定论。

3) Hash Join

仅针对CBO有效。

使用较小的Row source 做为Hash table和Bitmap. 而第二个row source被hashed，根据bitmap与第一个row source生成的hash table 相匹配，bitmap查找的速度极快。

例如:

select * from t1 inner join t2 on t1.id=t2.id

特别的，当Hash Table很大而不能所有留存在内存中的时候，这种Join策略更为实用。

可是，因为Bitmap自己的限制，这种join策略只适用在等值链接的状况下。

并且，在计算Hash Table的时候，须要考虑系统Hash_Area_Size参数设置。

show parameter hash_area_size