时间:2019.08
作者:Weiping Song, Chence Shi, Zhiping Xiao, Zhijian Duan, Yewen Xu, Ming Zhang, Jian Tang
使用Multi-head self attention来进行自动特征交叉学习
categorical feature和numerical feature都用embedding表示
使用multi-head self-attention把特征映射到不同子空间中,每个子空间可以学习到不同的特征组合
假设有H个注意力子空间,将每个子空间下的结果进行拼接,得到特征m的最终结果表示:
我们可以使用ResNet保留一些原始特征的信息留给下一层继续学习
最后,将每个特征的结果拼接,计算最终的输出值