Handling Conditional Discrimination(可解释歧视和确切的歧视)

文章创新点在于提出了一种新的概念,可解释属性和敏感属性之间的关联导致了可能存在一些“歧视”,这种“歧视”是可以被理解和接受的,可以被忽略和剔除的。再者,剔除的方法也是论文的一大改进之处。

Dall= Dexpl+ Dbad

Dexpl:举例子,学校录取学生,假设男女生各录取20人。其中男生报名的有100人,录取20人,录取率为20%。女生报名的200人,录取20人,录取率为10%。此时,总体上看男女生录取率是存在20%-10%=10%的偏差的,可能会误以为存在对女生的歧视,歧视值为10%。但是实际上呢,是因为女生报名的人数过多造成的,学校本身是不存在歧视的,对男女的录取人数相同。只不过是该校比较吸引女生,导致女生基数过大,竞争过大。这并不是学校存在歧视。这种歧视值被认为是可解释的歧视。

上述公式可理解为所有的歧视是可以分为可解释的歧视和错误(确切的)歧视。可解释歧视出现的原因是,属性,程序和决策之间存在一些关联。针对于这种可解释歧视,是可以删除的,文中提出采用“ local massaging ”,"Local Preferential Sampling",分别是本地推拿和本地优先抽样,也是论文的主要方法。

主要方法的大致思路是从数据集中选择特定属性的实例,根据可接受的概率将实例排序,输出的是标签。根据标签将其中男性