AI 日报

基于全局的图增强的新闻推荐算法

  • By 51ITO
  • Apr 08, 2024 - 2 min read



作者 | 汪昊

审校 | 重楼

新闻App 是人们日常生活中获取信息来源的重要方式。在 2010 年左右,国外比较火的新闻 App 包括 Zite 和 Flipboard 等等,而国内比较火的新闻 App 主要是四大门户。而随着今日头条为代表的新时代新闻推荐产品的火爆,新闻 App 进入了全新的时代。而科技公司,不管哪一家,只要掌握了高精尖的新闻推荐算法技术,就基本在技术层面掌握了主动权和话语权。

今天,我们来看一篇 RecSys 2023 的最佳长论文提名奖论文 —— Going Beyond Local: Global Graph-Enhanced Personalized News Recommendations (论文下载地址:https://arxiv.org/pdf/2307.06576.pdf)。这篇论文提出了一种全新的基于内容相似度计算的算法,用来进行新闻推荐。

该算法的整体架构图如下图所示:

我们首先按照如下方式定义新闻文本内容(我们这里只利用新闻标题)的词向量 X :

新闻的局部词向量特征可以按照如下方式进行表示:

这个公式是用户侧的特征表示。我们下面定义, 也就是局部实体特征。其实就是把所有的新闻标题拼成一个数组,然后再用上面的公式计算出来。

上面我们介绍的是局部特征表达和用户侧的特征表达。我们下面用 GNN 来表达全局的新闻侧特征向量:

全局新闻侧特征向量的最终表达其实就是把这些特征向量拼在一起:

整个新闻推荐系统的最终训练损失函数如下:

下面,我们来看一下实验对比效果:

经过对比(上表),我们发现我们新设计的算法(GLORY)在许多指标上都要优于同类算法,因此是不可多得的优秀的新闻推荐算法。整个算法设计思路非常简单,但是却用到了重量级的深度学习技术。想必作者在设计算法的过程中做了很多手艺类的工作,使得算法最终的效果达到了出类拔萃的程度。

下面是利用不同的 Graph Encoder 给新闻类文本编码的实验对比效果。可以看到,使用 GNN 得到的效果最优:

GLORY 是近年来出现的非常优秀的新闻推荐算法。虽然该算法没有逃脱基于内容的相似度计算的老旧框架,但是新瓶装旧酒,作者充分利用了新的技术,套在老的套娃里,产生了新的价值。这篇论文,非常值得我们认真学习。

作者介绍

汪昊,前 Funplus 人工智能实验室负责人。曾在 ThoughtWorks、豆瓣、百度、新浪等公司担任技术和技术高管职务。在互联网公司和金融科技、游戏等公司任职 13 年,对于人工智能、计算机图形学区块链和数字博物馆等领域有着深刻的见解和丰富的经验。在国际学术会议和期刊发表论文39 篇,获得IEEE SMI 2008 最佳论文奖、ICBDT 2020 / IEEE ICISCAE 2021 / AIBT 2023 / ICSIM 2024最佳论文报告奖。