Handling Conditional Discrimination（可解释歧视和确切的歧视）

时间 2021-01-09 标签机器学习公平性测试机器学习

文章创新点在于提出了一种新的概念，可解释属性和敏感属性之间的关联导致了可能存在一些“歧视”，这种“歧视”是可以被理解和接受的，可以被忽略和剔除的。再者，剔除的方法也是论文的一大改进之处。

Dall= Dexpl+ Dbad

Dexpl：举例子，学校录取学生，假设男女生各录取20人。其中男生报名的有100人，录取20人，录取率为20%。女生报名的200人，录取20人，录取率为10%。此时，总体上看男女生录取率是存在20%-10%=10%的偏差的，可能会误以为存在对女生的歧视，歧视值为10%。但是实际上呢，是因为女生报名的人数过多造成的，学校本身是不存在歧视的，对男女的录取人数相同。只不过是该校比较吸引女生，导致女生基数过大，竞争过大。这并不是学校存在歧视。这种歧视值被认为是可解释的歧视。

上述公式可理解为所有的歧视是可以分为可解释的歧视和错误（确切的）歧视。可解释歧视出现的原因是，属性，程序和决策之间存在一些关联。针对于这种可解释歧视，是可以删除的，文中提出采用“ local massaging ”,"Local Preferential Sampling"，分别是本地推拿和本地优先抽样，也是论文的主要方法。

主要方法的大致思路是从数据集中选择特定属性的实例，根据可接受的概率将实例排序，输出的是标签。根据标签将其中男性