现有的新闻推荐系统,尤其是深度学习方法,主要关注如何学习更好的用户与新闻表示。利用新闻丰富的文本信息,基于候选新闻与用户浏览过的新闻,精心设计一个news encoder 和user encoder。
然而现有的这些新闻推荐方法很少考虑到用户-新闻交互中潜在的高阶协同信号,捕获这种高阶关系可以深入挖掘用户新闻交互的结构信息,缓解数据稀疏性问题,如图1所示,反映了和的行为相似性,而又反映了和很可能有相似的目标用户。另外,用户通常是基于不同潜在偏好点击不同的新闻,用户-新闻交互的背后包含了复杂的潜在偏好因素,又如图1所示,用户由于对娱乐新闻的偏好而点击新闻,又因为对政治新闻的关注而点击新闻。因此,学习基于偏好因素解耦的用户与新闻表示可以增强新闻推荐的有效性和解释性。图1 左图展示用户-新闻交互图,右图展示了交互图中的高阶联系,以及按潜在偏好因素解耦的用户与新闻表示
针对以上问题,文章所提出的无监督偏好解耦新闻系统(简称GNUD)中,提出了以下解决方法:(1)为了捕获用户与新闻之间的高阶联系,将用户与新闻的交互构成二部图,然后利用多层GCN来聚合邻居信息得到目标用户或候选新闻的表示;(2)为了在学习用户和新闻表示过程中,能够解耦用户点击行为背后的潜在偏好因素,文章利用一种邻居路由算法,使得用户和新闻在图上聚合邻居信息时,能够根据不同潜在偏好因素考虑不同邻居的重要性,从而学到解耦的用户与新闻表示。如图2所示,不同颜色表示不同偏好因素,不同偏好因素下,用户和新闻所关注的邻居不同。(3)为了进一步加强这种解耦的有效性和解释性,使得解耦出来的不同表示能够更独立地反映相应的某一种偏好,文章进一步提出一种偏好正则器来对解耦的表示加强约束。如图2所示,该正则器,使得解耦出来不同表示空间与不同的偏好因素之间互信息最大化,从而进一步加强了解耦表示效果。
图2 模型框架图
我们验证了GNUD模型的有效性,如图3所示(后三行是GNUD模型的变体对比,包括去掉解耦与去掉偏好正则器两种):
图3 不同新闻推荐方法的效果对比