复旦发布「新闻推荐生态系统模拟器」SimuLine:单机支持万名读者、千名创作者、100+轮次推荐
理解在线新闻社区的演变对于设计更有效的新闻推荐系统至关重要,但由于缺乏适当的数据集和平台,现有研究在理解推荐系统如何影响社区演化方面存在局限,导致了可能影响长期效用的次优系统设计。
针对这一问题,复旦大学计算机学院CISL研究团队研发了新闻推荐生态系统演化模拟平台SimuLine。
SimuLine基于预训练语言模型(Pretrained Language Models)和逆倾向得分(Inverse Propensity Score)从真实数据中构建了一个反映人类行为的潜在空间,然后通过基于代理模型的仿真(Agent-based Modeling)模拟出新闻推荐生态系统的演化动态。
SimuLine支持在单服务器(256G内存,消费级显卡)上对10000 名读者和1000 名创作者进行100 轮次的创作-推荐-交互模拟,同时提供包括定量指标、可视化和文本解释在内的综合分析框架。
广泛的仿真实验表明SimuLine在理解社区演化过程、测试推荐算法等方面具有巨大潜力。
作者:张光平,李东胜,顾寒苏,卢暾,尚笠,顾宁
论文地址:https://arxiv.org/abs/2305.14103
新闻推荐生态系统演化模拟平台
随着社交媒体(Social Media)的普及,人们越来越依赖在线新闻社区来发布和获取新闻,每天都会有数以百万计的新闻被内容创作者发布到各种类型的在线新闻社区,并在推荐系统的分发下被海量用户阅读。
随着新闻内容的生产和消费,在线新闻社区处于一种不间断的动态演化过程中。
与其他类型的在线社区相同,在线新闻社区的发展也符合著名的生命周期理论,也即依次经历「启动」-「成长」-「成熟」-「衰退」的阶段。
透过生命周期理论的视角,大量的研究工作探讨了在线社区的演化模式,并对生命周期中每个阶段的运作提出了建议。
然而,作为在线新闻社区最重要的技术基础设施之一的推荐系统对在线新闻社区的演化有何影响仍迷雾重重。
为了解开这一谜团,来自复旦大学计算机学院的CISL研究团队重点关注了以下三个研究问题,并试图通过模拟实验来找到它们的答案:
1)新闻推荐生态系统(News Recommendation Ecosystems, NREs)生命周期的每个阶段有什么特点?
2)驱动NREs演化的关键因素有哪些,这些因素是如何彼此作用进而影响进化过程的?
3)如何通过推荐系统的设计策略,实现更好的长期多方效用,从而避免社区陷入「衰落」?
为了回答这三个研究问题,CISL研究团队研发了新闻推荐生态系统演化模拟平台SimuLine。
SimuLine首先根据真实世界的数据集进行合成数据的生成。为了解决原始数据集固有的暴露偏差问题(Exposure Bias), SimuLine引入了逆倾向得分(Inverse Propensity Score)来消除偏差。
为了建立一个贴近人类决策过程的潜在空间,SimuLine引入了基于大规模语料库的预训练语言模型(Pretrained Language Models)来进行隐空间的构建,最后,SimuLine通过基于代理模型的仿真(Agent-based Modeling)模拟了用户、内容创作者和推荐系统在新闻推荐生态系统中的行为和交互。
合成数据生成
当试图动手构建一个代表用户的模拟器时,扑面而来的第一个问题就是「用户的各种行为应当如何刻画?」
这个问题其实有一个十分直接而且被推荐系统领域广泛采用的解决思路,那便是构建一个隐空间(Latent Space),然后把用户的兴趣和新闻的内容通通映射到这个空间里去。
如此一来,便可以十分方便地通过隐空间中向量的相似度,来衡量用户对新闻的喜爱程度,进而定义出一系列行为的逻辑和规则。
构建
那么该如何构建这个隐空间呢?
有的同学便说了:「这有何难!?推荐算法不就是用来干这个活的嘛!直接用推荐算法学一个出来不就好了?」
这的确不失为一种方法,但也有一些明显的问题。
其中最令CISC研究团队百思不得其解的是一个叫做「Algorithm Confounding」的逻辑漏洞,也就是说假如使用推荐算法A来构建隐空间并映射用户和新闻作为它们真实的行为决策依据,那么在后面模拟过程中使用的算法B岂不成了在拟合算法A(了解一些蒸馏学习的同学是不是很眼熟)?
此外,目前大多数的推荐算法仍是黑盒模型,就算睁一只眼闭一只眼放过了Algorithm Confounding,在对模拟数据进行分析的时候也会是一头雾水(这个维度在变大,可是这个维度代表啥啊???)。
正当研究团队一筹莫展之际,一道白色的闪光划过:好像之前看到过一篇文章说,基于大规模语料库训练出来的语言模型(当时还是Bert的天下,ChatGPT尚未呱呱坠地)可以表现出一些基本的人类认知(也就是著名的King – male Female = Queen)。
那这个东西用来构建隐空间岂不是非常合适:
1. 它可以编码用户和新闻;
2. 通过从大规模语料库中学习全局的文本表征,它所体现的人类认知应该是基础而普遍的,从而规避了Algorithm Confounding的问题;
3. 虽然不太清楚它的隐空间里每一个维度代表了什么,但这并不影响这个空间的可理解性,完全可以通过相似向量检索来为空间中每一个点提供文本的大致解释。
这简直太美妙了!就决定是你了!
映射
解决了隐空间的构造问题,下一步就是将用户和新闻映射到这个空间了。
新闻好说,本来新闻就一定会有丰富的文本信息,直接编码就可以了,但是用户该怎么去处理呢?利用用户历史记录里喜欢的新闻求个均值行不行?
不可以!
可恶的Algorithm Confounding换了个名字又来了,这次它叫做Exposure Bias,也就是用户的点赞记录并不一定能够完全体现出用户的兴趣,因为用户点赞的新闻一定是用户看到过的新闻,而用户看到的新闻本身就是经过推荐系统的一次筛选的,完全存在一种可能性那就是用户没点赞是因为没看到。
还好经过这么多年的高歌猛进,推荐系统领域的军火库弹药充足,研究团队从Unbiased Recommendation这个仓库中找到了解决这个问题的趁手兵刃:Inverse Propensity Score (IPS)。
简单来讲,那便是通过估计推荐样本的曝光密度对其进行加权,从而抵消掉它在模型学习过程中带来的Bias,如此一来用户的编码问题也就解决了。
至于最后的内容创作者,他们发布内容的行为没有受到Exposure Bias的干扰,直接对其历史记录进行加权就行了。其实经过上面的一通操作,数据准备工作已经基本完成了,但是仍有两点美中不足:
· 首先是数据规模尚未调整,可能会和计算资源不适配(小驴拉大磨/大驴磨洋工);
· 其次是用户的隐私没有得到尊重。因此研究团队在原始数据集用户编码的基础上又套接了一层生成模型。
考虑到新闻平台总是设计有分区导航(财经、体育、科技等等),而用户在各个分区的聚集现象也比较明显,研究团队便提拔了高斯混合模型(GMM)来负责这个任务。
代理建模
完成了前期的数据准备工作之后,便可以开始建模用户的行为了。
研究团队这里采用了Agent-based Modelling的方式,也就是建模个体的行为以及个体之间的交互,然后通过部署大量Agents模拟出群体的动态。
简单回忆一下用户的在线新闻阅读流程(比如大家刷今日头条的时候),用户首先会在某一个页面看到推荐系统推荐的一系列新闻,然后用户简单浏览一下各个新闻的标题、配图和摘要,如果某条新闻激起了用户的兴趣,便会点进去看看具体讲了些什么,读完这条新闻之后,如果用户觉得这条新闻不错、值得大家一读或是符合自己的观点,用户便会通过点赞等方式表达自己对这条新闻的认同。
定义
在这个过程中,用户和新闻之间的交互可以被划分为三个层级(曝光、点击和点赞),其中点击和点赞是用户的主动行为,需要在User Agent中定义一番。
在这里研究团队将用户的点击行为归纳为一种概率选择行为,也就是依据用户和新闻之间的匹配度(可以用两者隐空间内的相似度衡量),用户有一定概率从列表中选择一些自己感兴趣的新闻点开阅读。
这个定义相比于直接点击最匹配的新闻具有更好的弹性,也就是说并不一定匹配度高就会被阅读,更符合真实情况一些。
至于点赞行为,就不能简单的只考虑新闻的匹配度了,毕竟众所周知,标题党的现象在新闻中还是屡见不鲜的。
因此研究团队引入了一个抽象的「新闻质量」的概念来总体上代表一篇新闻报道的价值,如此一来,用户的点赞行为便可以通过主观的兴趣和客观的质量共同刻画。
研究团队采用了期望模型来进行Agent点赞行为的控制,具体来讲,首先基于兴趣匹配程度和新闻质量计算出一个用户阅读某条新闻的效用(Utility),如果这个效用超过了用户的期待(研究团队用一个超参数Threshold来代表这个期待的具体值),那便触发点赞行为。
这个设计的直观解释就是,如果一条新闻有让我爽到,不管是因为它迎合了我还是它本身的报道十分客观全面,我便会毫不吝啬的为他点赞。
此外在新闻阅读过程中,用户的兴趣或者说观点显然也不会是一成不变的。
比如说用户看到了一篇很喜欢的新闻报道,就有可能激发用户对相关新闻的深入挖掘欲望,与之相反的,如果一篇报道令用户感觉完全是满纸荒唐言,用户以后再看到类似的报道就不太会再点进去看它的报道细节了。
这个现象被研究团队建模为了一个用户偏好漂移模型(User-drift Model)。
创作行为建模
接下来建模新闻创作者的创作行为。
真实世界中的新闻创作会受各种因素的影响,研究团队这里将其简化为一个贪心过程,也就是作者总是希望自己创作的新闻能够得到更多读者的认同。
具体的Agent行为控制研究团队采用了类似于用户点击的方案,创作者根据自己创作的新闻在上一轮的点赞情况进行概率抽样,选出新一轮创作的主题,然后围绕主题进行新闻创作。新闻创作的过程类似的也被建模为隐空间中从以主题为中心的高斯分布中抽样的过程。
除了新闻的内容(隐空间表征),还需要对新闻的质量进行建模。这里基于两条符合现实规律的基本假设:
1. 作者的获赞数与收入存在一个边际递减的正相关关系,也就是作者收到的赞越多收入阅读,但是随着赞数量的提升,单个赞带来的收益会逐渐减少;
2. 收入高的创作者由于预算更充足,会创作出质量更高的新闻。基于此可以构建一个从上一轮获赞数到下一轮新闻质量的映射函数,用于控制新闻创作的质量。
推荐系统建模
最后对推荐系统的行为进行建模。
算法推荐和冷启动推荐是新闻推荐系统的两个基本组件。为了提供个性化的算法推荐,推荐系统首先利用推荐算法,如BPR等,从历史交互数据中学习用户和新闻在嵌入空间中的表示(研究团队用隐空间Latent Space指代大规模语言模型编码的真实用户兴趣空间,用嵌入空间Embedding Space指代推荐算法学习得到的用于生成推荐列表的空间)。
但是由于用户点赞行为的不确定性和新闻有效性窗口的限制,算法推荐不能保证覆盖所有用户,对于这部分缺口,可以通过简单的随机推荐予以补全。
由于缺乏历史交互记录,新创作的新闻同样无法参与到算法推荐中,SimuLine应用随机推荐和启发式推荐算法(如历史上喜欢的创作者的新报道)等策略来推荐冷启动新闻。
此外,SimuLine还支持了其他启发式新闻推荐策略,如突发新闻,基于内容创作者的推广,以及基于主题的推广等。
所有的推荐策略均拥有独立的推送额度,推荐系统将来自所有渠道的新闻推荐合并形成最终的推荐列表。
模拟实验
数据已就位!模型已搭建!接下来进行一番紧张刺激的实验!
研究团队选用了新闻推荐领域广泛使用的Adressa数据集,这个数据集提供了挪威新闻网站www.adressa.no在2017年二月某一周的完整网络日志,与其他优秀的新闻推荐数据集(例如微软的MIND)相比,它原生提供了十分关键的新闻作者信息。相对应的,语言模型选用了原生支持挪威语的BPEmb。更多的部署细节诸位可以参考论文中的第四章第一小节。
那么该如何去分析SimuLine的模拟结果呢?SimuLine提供了一套多个视角的全面分析框架供君参考。
首先是最常用的量化指标评估体系。
为了全面反映新闻推荐生态系统的演化过程,研究团队总结了已有文献中出现过的量化指标,从以下五个方面构建了一套较为完整的评估体系:
1)互动性,包括点赞获赞的数量及其基尼指数,较低的基尼指数代表更好的公平性;
2)覆盖率,包括算法推荐所覆盖的用户和新闻的数量;
3) 质量,包括时效期新闻的平均质量、获赞量加权的时效期新闻平均质量以及新闻质量与获赞量之间的皮尔逊相关系数;
4)同质化,包括用户间的Jaccard指数,数值越高代表用户之间的新闻阅读重合程度越高;
5)匹配度,包括用户和他们喜欢的新闻之间的隐空间表征余弦相似度。
1. 生命周期
下面三张图分别展示了在不同Agent超参数条件下,用户、创作者、推荐系统的量化评估结果。
可以看到,模拟的过程和结果在各种超参数下都是比较稳定的,并且大约以第十轮和第二十轮为分界线(不同指标存在一定的前后浮动),系统的演化呈现出了明显的阶段性(在图中用蓝色的竖线画出了发生阶段转换的轮次),这与著名的生命周期理论相一致。
由此得到第一个发现:推荐系统驱动的在线新闻社区在不同的用户群体下均自然呈现出「启动」-「成长」-「成熟&衰退」的生命周期。
2. 用户分化
除了量化指标,可视化也是辅助理解社区演化过程的重要工具。
研究团队通过PCA降维可视化得到了下面这一组系统演化过程的快照(新闻用蓝色标示,有点赞记录的用户用绿色标示,没有点赞记录的用户用红色标示。节点大小代表点赞/获赞的数量)。
可以看到,虽然量化指标表现出了多阶段的模式,但隐空间表征的演化趋势却是始终如一的,即用户逐渐分化为圈内用户(in-the-loop users)和圈外用户(out-the-loop users)。
圈内用户形成了一个兴趣趋同的稳定社区,而圈外用户则呈现出零散的兴趣。
在第10轮和第20轮之间的演化过程中,用户基本完成了分化,这表明成长阶段对用户参与有至关重要的决定作用。
由此得到第二个发现:推荐系统驱动的在线新闻社区将不可避免地产生社区话题的趋同,并导致用户的分化,其中决定用户参与的关键时期是成长阶段。
3. 兴趣同化
如前文所说,由于SimuLine通过大规模预训练语言模型来构建隐空间,空间中的每个向量都可以通过相似词检索来进行文本解释,这有助于通过案例研究了解单个用户的演变。
研究团队分别从圈内用户和圈外用户中随机抽取了3名用户,下面的表格展示了他们的兴趣演化过程。
对于圈内用户来说,他们的兴趣愈发抽象、广泛和概括,例如从「演员」到「工作」,从「奥斯陆」到「挪威」到「欧洲」。不同用户的演化速度各不相同,但都在第50轮时趋于一致。这一现象反映了作为不断与推荐系统互动的结果,用户的偏好从个性化的小众话题逐渐迁移到平台上广泛讨论的趋势性话题。
而对于圈外用户来说,他们的兴趣略有变化,但总是集中在特定的和个性化的话题上。例如4号和6号用户在整个模拟过程中分别对「运动员」、「茶」和「账单」保持兴趣。
由此得到第三个发现:在推荐系统驱动的在线新闻社区中,用户的个性化兴趣在与推荐系统的持续互动过程中被同化了。
4. 启动阶段
借助上述量化指标、可视化、文本翻译三大利器,SimuLine可以对系统的演化过程进行一次全面体检。
既然推荐系统驱动的在线新闻社区的演化过程符合生命周期理论,那就从生命周期的视角分析一下,在各个生命阶段,社区到底是怎么演化的。
首先分析一下大致对应前10轮的启动阶段。
由于系统是白手起家从零做起,所以在最开始的阶段推荐系统是缺乏数据训练推荐算法的。相对应的,在这一阶段利用随机推荐和启发式推荐解决用户的冷启动问题便是首要任务。
由于无法使用更为准确的算法推荐,该阶段的推荐结果往往在兴趣匹配上不尽人意,因此该阶段的点赞行为主要由新闻质量驱动,反映在量化指标上那便是质量和热度的较强的正相关关系。
更进一步,便可以定位出启动阶段社区演化的两个主要驱动力量:
1)质量反馈回路(Quality feedback loops),即质量与热度在正相关关系基础上的相互促进,也就是东西越好点赞的人越多,点赞的人越多作者收益越高,作者收益越高越有动力产出质量更好的新闻报道;
2)兴趣-质量混淆,也就是在积累到足够准确估计用户兴趣的数据量之前,推荐算法会将质量驱动的点赞行为混淆为因为用户感兴趣而触发的行为。这两个驱动力量相互促进,使得受欢迎的内容创作者获得逐渐增强的超量曝光(体现为创作者和新闻基尼指数的上升),并近一步挤压用户个性化兴趣的满足(体现为用户与其点赞新闻之间隐空间相似度的下降)。但是大多数用户仍可以从增强的新闻质量中受益(体现为不断降低的用户点赞行为的基尼指数)。
总结一下,可以得到第四个发现:在启动阶段,系统从随机推荐和高质量新闻中积累用于估计用户兴趣的数据,进而解决冷启动用户问题。质量反馈循环和兴趣-质量混淆通过过度曝光促成了极受欢迎的内容创作者的出现。
5. 成长阶段
随着数据的积累,推荐算法对用户兴趣的估计越来越准确,点赞行为从质量驱动逐渐转向兴趣驱动,质量和热门程度之间的相关性逐渐减弱。随着模拟轮次的增长,启动期创作的新闻逐渐过期并退出推荐候选,兴趣-质量混淆率先开始消散,并逐渐导致质量反馈循环的最终结束。
在成长阶段,每个圈内用户临域内的新闻密度是不均匀的,朝向主流新闻主题的方向密度较高,而其他方向的密度相对较低。
其结果便是用户喜欢的新闻在统计上更多的会向主流新闻主题靠拢,这一点赞行为上的细微偏差不断出现,用户兴趣在持续的强化作用下也逐渐向主流新闻主题逼近。
与之相反的是,圈外用户陷入了「不点赞-算法推荐无法覆盖-推荐准确度低-更不会点赞」的僵局。他们偶尔也会因为新闻质量而点赞,但推荐算法无法在数据时效内积累到足够的数据估计他们的兴趣。更频繁和均衡的点赞行为刺激了新闻质量的增长,但由于高质量新闻的受欢迎程度下降,按获赞数量加权的新闻质量总体上保持了稳定。
随着质量反馈循环的终止,内容创作者无法再获得超量关注,从而导致新闻质量的下降。对质量敏感的用户可能会因此而不再点赞,进而导致用户覆盖率的下滑。
总结起来,可以得到第五个发现:在成长阶段,圈内用户在分布偏差的作用下向共同话题演化,而圈外用户则陷入僵局,导致了用户分化。越来越准确的算法推荐导致质量反馈循环的结束,社区因此而丧失了部分质量敏感的用户。
6. 成熟和衰退阶段
在第20轮左右,社区进入了成熟和衰退阶段,此时大多数关键指标趋于稳定。
在此阶段,圈内用户动态地保持在共同话题的气泡中,虽然他们的兴趣可能会因为点击一些不同的新闻而转移到气泡的边缘,但他们很快就会因为密度差而回到中心。
新闻获赞的基尼指数较高,而内容创作者的获赞基尼指数较低,说明即使是同一创作者创作的新闻,其受欢迎程度也存在很大差异。
除了贪婪的创作机制,新闻创作的过程本身具有高度随机性,因此气泡也呈现出自然的扩张趋势。
扩张的气泡带来了更多样化的新闻候选,也导致了部分对话题敏感的用户逐渐退出。
由此可以得到第六个发现:在成熟和衰退阶段,圈内用户共享共同的话题,内容创作者围绕这些话题发布各种新闻。社区保持了稳定且缓慢的扩张,但同时也流失了部分对兴趣敏感的用户。
7. 演化是如何发生的?
发现一到发现六回答了研究团队关注的第一个研究问题:新闻推荐生态系统(News Recommendation Ecosystems, NREs)生命周期的每个阶段有什么特点?
接下来把所有的知识拢起来,尝试回答一下第二个研究问题:驱动NREs演化的关键因素有哪些,这些因素是如何彼此作用进而影响进化过程的?
下面这张图总结了在线新闻社区演化的关键因素和影响机制,从中可以发现,重新出现的曝光偏差和死锁是导致圈内用户和圈外用户不同演化趋势的直接原因,并进一步导致了用户的分化和话题的趋同。
重新出现的曝光偏差是由多种因素共同造成的。
首先,从信息论的角度来看,推荐算法可以解释为一个信息压缩的过程,不可避免地导致流行度偏差,其中在数据集中高频出现的新闻(也就是点赞多的新闻)被更有效地编码以提高推荐性能。反映到社区的演化过程上,便体现为广泛讨论的共同话题会在算法推荐渠道上抢占个性化话题的曝光资源。
其次,由于内容创作者的逐利性,他们更有动力围绕公众感兴趣的话题创作新闻,这自然而然的会导致新闻发布密度从大众话题向个性化话题的降低。从这个意义上来看,即使全程采用随机推荐,社区也可能由于分布的偏差而朝着主题收敛的方向发展。
最后,过滤气泡和曝光偏差相互促进,共同导致了用户潜移默化的兴趣转移。算法推荐根据用户历史上点赞过的新闻推荐类似的报道,受限的新闻曝光使得曝光偏差更加难以被用户感知。
此外,推荐系统对流行新闻的偏向在不同的演化阶段表现出了不同的影响。
在启动阶段,存在兴趣-质量混淆,新闻质量与流行度之间存在较强的相关性,流行偏向具体表现为高质量新闻曝光度的增强。
随着数据的积累和算法推荐性能的提升,与质量驱动相比,点赞行为越来越受兴趣驱动,进而削弱了兴趣-质量混淆和质量-流行度相关性。流行偏向也从推荐优质新闻逐渐演变为单纯的推荐高热度新闻。
在这个新旧动能转换的过程中,培育出一些高人气同时高质量的新闻话题,对促进用户参与具有重要作用。
总结下来,便可以得到第七个发现:流行偏向、新闻分布偏差和过滤气泡共同导致了曝光偏差这一影响用户差异化和话题收敛的关键因素。高人气的优质新闻对于打破圈外用户的僵局至关重要。
8. 如何避免社区衰落?
最后,借助SimuLine强大的模拟能力和分析能力,再探索一番第三个研究问题:如何通过推荐系统的设计策略,实现更好的长期多方效用,从而避免社区陷入「衰落」?
研究团队测试了四种最基础最常见的启发式推荐方法:基于订阅制的新闻冷启动、热搜榜、话题推广和创作者推广。下面三张图呈现了在基础推荐系统之上应用上述四种方法的社区演化结果。
(1)基于订阅制的新闻冷启动试图在用户和内容创作者之间形成稳定的跨轮曝光关系,从而增强启动阶段出现的质量反馈循环。
但是这种做法导致了严重的垄断,没有取得先发优势的内容创作者反而会被质量反馈回路压制,破坏了算法覆盖率和新闻的平均质量,进而使整个社区生态的多样性受到严重挑战。
(2)热搜榜是最常见的在线社区组件,依靠新闻质量和流行度之间的正相关关系,这种方式可以为用户提供更高质量的新闻推荐。同时从利用和探索(Exploit&Explore)的角度来看,阅读突发新闻也可以看作是一种突破用户现有兴趣局限的用户探索,有助于减轻过滤气泡的负面影响。
然而,这种方法无法阻止前文中讨论的流行度和质量之间相关性的崩溃,这会导致推荐突发新闻的有效性下降。
(3)最后是平台推广,通过给特定话题或者特定作者提供额外的曝光额度,平台也可以主动地调控推荐的内容。针对内容创作者的推广可以建立起稳定的曝光关系,进而利用质量反馈回路培养高人气的优质新闻。
但与基于订阅制的新闻冷启动策略不同的是,可以在当前质量反馈循环培育出有害的垄断之前主动终止推广,从而保障了用户的体验和创作者的创造力。作为一个独立于兴趣匹配的新闻传播渠道,它同样可以减轻过滤泡沫的负面影响。此外,通过重建质量反馈回路,它还将推荐系统对流行新闻的偏向导向对高质量新闻的有益推荐。
SimuLine在针对特定话题推广的实验中随机选择话题,也就是说热门话题与个性化话题有同等的机会被推广,因此对于曝光度相对较低的个性化话题,推广的影响相对较大。
这个方法理论上可以用于提升圈外用户的参与度,但由于推广新闻的质量无法得到保证,曝光量难以转化为获赞数,导致了该方法效果有限。
总结起来,便可以得到第八个发现:在常见的推荐系统设计策略中,针对内容创作者的周期性推广是最有效的。通过积极构建质量反馈回路,它可以在整个社区中营造一波接一波的高人气高质量的新闻话题,同时平台可以通过定期的重置来控制垄断。
小结
在这篇文章中,CISL研究团队设计并开发了用于剖析新闻推荐生态系统演化过程的仿真平台SimuLine,并基于SimuLine对在线新闻社区的演化过程进行了详细分析。
SimuLine 构建了一个很好地反映人类行为的可理解的隐空间,并在此基础上通过基于代理的建模对新闻推荐生态系统进行了细致的模拟。
研究团队剖析了在线新闻社区演化的整个生命周期,包括启动、成长、成熟和衰退阶段,并分析了每个阶段的特征,同时提出了一个关系图来说明演化过程中的关键因素和影响机制。
最后,研究团队探讨了推荐系统设计策略对社区演化的影响,包括对订阅制新闻冷启动、热点新闻和平台推广的利用。
未来,CISL研究团队会考虑新闻的文本内容生成和社交网络活动的行为建模,以进行更强大更真实的模拟。
研究团队认为SimuLine也可以作为推荐系统评估的一大利器,提供在线用户实验和基于数据集的离线实验之外的第三种选择(这也是给它起名为SimuLine的主要原因)。
研究团队也注意到最近推荐系统研究社区也提出了一系列的纠偏推荐算法,旨在处理推荐中的曝光偏差问题,这也是用户分化和主题收敛的直接原因。
由于本文侧重于讨论推荐系统的系统设计而不是具体的推荐算法,研究团队将这个问题留作一个开放的主题,并希望 SimuLine 能够促进未来在这个方向的研究。
参考资料:
https://arxiv.org/abs/2305.14103
- 0001
- 0002
- 0000
- 0000
- 0000