纵向LR+同态加密+feature binning方法

时间 2021-06-10 标签 # Federated_Learning 算法

—————————————图示——————————————

—————————————说明——————————————
（一）算法步骤：

（1）guest把 {idi, Encry(yi), Encry(1-yi)}，发送给host；

（2）host根据分箱情况，对于每个bin，计算{Encode(id_set_i),sum(Encry(yi)),sum(Encry(1-yi))}发送给guest；

（3）guest根据同态加密和标签的特性（0-1分类），guest可以计算出npos_i=Decry(sum(Encry(yi)));nneg_i= Decry(sum(Encry(1-yi)))；

（4）guest可以计算出最后结果：WOE和IV值；distpos_i= npos_i/pos_total; distneg_i=nneg_i/neg_total. Woe_i= 100 * log(distpos_i/ distneg_i)；IV =sum((distpos_i - distneg_i)*log(distpos_i/disneg_i)

（二）理解说明

（1）guest把label加密发过去，id是明文发过去；收到的host的计算结果后再解密，进而可以计算WOE；从而可以计算IV；

（2）对确定的feature字段，host根据自己的（或者约定好的）分箱规则和guest发过来的id，可以得到每个bin里面的id是多少，从而可以对每个bin里id对应的label求和（密文求和）；然后把所有的箱子和它的label的和发给guest；

（3）这个分箱策略依赖于同态加密的特点和0-1分类问题的特点。