纵向LR+同态加密+feature binning方法

转自官方文档 FATE:新一代联邦学习技术及应用实战.PDF

—————————————图示——————————————

在这里插入图片描述—————————————说明——————————————
(一)算法步骤:

(1)guest把 {idi, Encry(yi), Encry(1-yi)},发送给host;

(2)host根据分箱情况,对于每个bin,计算{Encode(id_set_i),sum(Encry(yi)),sum(Encry(1-yi))}发送给guest;

(3)guest根据同态加密和标签的特性(0-1分类),guest可以计算出npos_i=Decry(sum(Encry(yi)));nneg_i= Decry(sum(Encry(1-yi)));

(4)guest可以计算出最后结果:WOE和IV值;distpos_i= npos_i/pos_total; distneg_i=nneg_i/neg_total. Woe_i= 100 * log(distpos_i/ distneg_i);IV =sum((distpos_i - distneg_i)*log(distpos_i/disneg_i)

(二)理解说明

(1)guest把label加密发过去,id是明文发过去;收到的host的计算结果后再解密,进而可以计算WOE;从而可以计算IV;

(2)对确定的feature字段,host根据自己的(或者约定好的)分箱规则和guest发过来的id,可以得到每个bin里面的id是多少,从而可以对每个bin里id对应的label求和(密文求和);然后把所有的箱子和它的label的和发给guest;

(3)这个分箱策略依赖于同态加密的特点和0-1分类问题的特点。