相关分析

https://blog.csdn.net/longxibendi/article/details/82558801

0画图

1典型相关分析

2相关系数

pearson相关系数、复相关系数

相关关系是一种非确定性的关系,相关系数是研究变量之间线性相关程度的量。由于研究对象的不同,相关系数有如下几种定义方式。
简单相关系数:又叫相关系数或线性相关系数,一般用字母r 表示,用来度量两个变量间的线性关系。
定义式 [1]
在这里插入图片描述

其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差
复相关系数:又叫多重相关系数。复相关是指因变量与多个自变量之间的相关关系。例如,某种商品的季节性需求量与其价格水平、职工收入水平等现象之间呈现复相关关系。
典型相关系数:是先对原来各组变量进行主成分分析,得到新的线性关系的综合指标,再通过综合指标之间的线性相关系数来研究原各组变量间相关关系。

spearman等级相关系数

斯皮尔曼相关系数被定义成等级变量之间的皮尔逊相关系数。对于样本容量为n的样本,n个原始数据被转换成等级数据,相关系数ρ为
在这里插入图片描述

原始数据依据其在总体数据中平均的降序位置,被分配了一个相应的等级。如下表所示:
变量Xi 降序位置 等级xi
0.8 5 5
1.2 4
1.2 3
2.3 2 2
18 1 1
实际应用中,变量间的连结是无关紧要的,于是可以通过简单的步骤计算ρ.被观测的两个变量的等级的差值,则ρ为

在这里插入图片描述

3 回归

一元

多元

信息熵和互信熵

https://www.cnblogs.com/liugl7/p/5385061.html
自信息和互信息、信息熵

互信息、条件熵与联合熵的区别与联系
https://blog.csdn.net/ranghanqiao5058/article/details/78458815
在这里插入图片描述