统计--Mahalanobis distance(马氏距离)

转自维基:https://en.wikipedia.org/wiki/Mahalanobis_distance

Mahalanobis距离是点P和分布D之间距离的度量,由P.C.Mahalanobis于1936年引入。[1]它是测量P离D平均值多少标准差的概念的多维概括。如果P在D平均值处,则此距离为零,随着P沿着每个主分量轴移动远离平均值而增长。如果每个轴都被重新缩放为具有单位方差,则马氏距离对应于变换空间中的标准欧氏距离。因此,Mahalanobis距离是无单位和尺度不变的,并且考虑了数据集的相关性。

马氏距离在数据空间的全秩线性变换下保持不变。这意味着,如果数据有一个非平凡的零空间,那么在将数据(非简并地)投射到数据的适当维度的任何空间之后,就可以计算Mahalanobis距离。