LightGCN - Simplifying and Powering Graph Convolution Network for Recommendation[SIGIR'20]

SIGIR20一篇简化GCN架构的论文

解决的问题

在协同过滤中,图卷积网络中的特征转换与非线性激活对提升模型表现贡献很小,甚至有负面影响。

在半监督顶点分类问题中,每个顶点有充分的语义特征作为输入,例如一篇文章的标题与摘要词,这种情况下加入多层的非线性特征转换能够有助于学习特征。而在协同过滤任务中,每个顶点(用户或商品)没有这么充分的语义特征,因此没有多大的作用。

做法及创新

0evf4P.png
  1. 仅考虑图卷积网络中的neighborhood aggregation,通过在用户-物品交互网络中线性传播来学习用户和物品的embedding,再通过加权和将各层学习的embedding作为最后的embedding

  2. 通过减少不必要的架构,相较于NGCF大大减少了需要训练的参数量。唯一需要训练的模型参数是第0层的embedding,即$e_u^{(0)}$与$e_i^{(0)}$,当它们两个给定后,后续层的embedding可以通过传播规则直接进行计算

以加权和的方式结合各层的embedding等价于带自连接的图卷积

  1. 模型的可解释性更强,以二层网络为例:

如果另一个用户$v$与目标用户$u$有关联,则影响以下面的系数表示:

可解释为:

  • 共同交互过的物品越多系数越大 $i\in N_u\cap N_v$
  • 物品流行度越低系数越大$\frac{1}{|N_i|}$
  • 用户$v$越不活跃系数越大$\frac{1}{|N_v|}$

数据集

Gowalla、Yelp2018、Amazon-Book