机器学习 —— 联合概率分布

定义

联合概率分布简称联合分布,对随机向量X={X1,X2…Xm}的概率分布,称为随机变量X1,X2…Xm 的联合概率分布。根据随机变量的不同,联合概率分布的表示形式也不同。对于离散型随机变量,联合概率分布可以以列表的形式表示,也可以以函数的形式表示;对于连续型随机变量,联合概率分布通过非负函数的积分表示。


随机变量

如果随机变量X的取值是有限的或者是可数无穷尽的值,则称X为离散随机变量。

如果X是由全部实数或者由一部分区间组成,则称X为连续随机变量,连续随机变量的值是不可数及无穷尽的。

随机变量分为离散型随机变量和连续型随机变量,当要求随机变量的概率分布的时候,要分别处理。


离散型

对于二维离散随机向量,设X和Y都是离散型随机变量,{xi} 和 {yi}分别是X和Y的一切可能的几何,则X和Y的联合概率分布可以表示为列联表,
这里写图片描述

也可以表示为函数形式
这里写图片描述
其中,
这里写图片描述
多维随机变量的中,只包含部分变量的概率分布称为边缘分布:
这里写图片描述
这里写图片描述
对于多维(维数大于等于3)离散型随机变量 X1,X2…Xm 的联合概率分布以此类推。


连续型

对于二维连续随机向量,设X和Y为连续型随机变量,其联合概率分布,或连续型随机变量 (X,Y)的概率分布F(x,y) 通过一非负函数 f(x,y)≥0 的积分表示,称函数 f(x,y)为联合概率密度。

两者的关系如下:

这里写图片描述

这里写图片描述

f(x,y)不但完全决定X和Y的联合概率分布,而且完全决定X的概率分布和Y的概率分布,以 f1(x)和 f2(y)分别表示X和Y的概率密度,则

这里写图片描述
这里写图片描述

对于多维(维数大于等于3)连续型随机变量 X1,X2…Xm 的联合概率分布以此类推。


转载地址:

https://baike.baidu.com/item/%E8%81%94%E5%90%88%E6%A6%82%E7%8E%87%E5%88%86%E5%B8%83/12611723