个性化新闻推荐发展动力及趋势研究
谢新洲 王强
【摘要】个性化新闻推荐已经成为新闻服务的主要形式。用户的信息需求是个性化新闻推荐的原动力,但同时互联网技术、移动互联网技术、感知和推荐技术、大数据和云计算技术的发展以及产业化的催化在个性化新闻的发展中也发挥了举足轻重的作用。在此基础上,结合相关技术发展动向,提出个性化新闻推荐未来将实现数据广泛融合,智能感知和推荐技术将使个性化新闻推荐服务更加精准,使用场景更加多元,个性化新闻推荐的价值将从内容精准对接走向产品、服务和内容的全面精准对接,与此同时,“个性化—隐私悖论”问题将随着个性化新闻推荐的发展及其深度嵌入人类社会生活而日益突出。
【关键词】个性化新闻推荐;信息需求层次;信息技术推动;产业化;发展动力;发展趋势
大数据、云计算、人工智能等技术的快速发展,对新闻传播的创新发展产生了革命性影响,不断推动传播向精准化、个性化、智能化方向发展。移动互联网迅速普及,使手机成为新闻工作者与用户之间无时不在的互动通道。随着技术的不断进步和用户量的不斷增长,个性化新闻推荐(PersonalizedNews Recommendation,以下简称PNR)已经成为新闻服务的主要形式,今日头条、Flipboard等国内外聚合新闻类产品自推出后快速成长,取得了较高的市场占有率。[1]
本文根据信息需求层次理论探究PNR产生发展的拉动力量,结合技术发展对PNR的推动和产业化对PNR发展的催化作用,探析PNR发展的主要动力。在此基础上,结合相关技术的发展,对PNR未来趋势进行分析。一、相关研究
尼古拉斯·尼葛洛庞帝(NicholasNegroponte)对机器交互性的设想标志着个性化新闻推荐的萌芽[2],他随后提出了“我的日报”(TheDailyMe)理念,并在《数字化生存》(BeingDigital)一书中较为详细地展现了其对“我的日报”的设计。[3]
1993年,麻省理工学院媒体实验室发起的新闻订制服务实验项目FishWrap是个性化新闻推荐最早的实践。[4]此后,互联网迅速普及,雅虎、谷歌等互联网巨头纷纷推出个性化新闻服务。雅虎推出了个性化服务项目“MyYahoo!”,通过界面个性化设置和RSS推送,实现了新闻内容的个性化推荐。[5]谷歌则依靠其搜索技术的优势,推出了谷歌新闻(GoogleNews),汇集来自世界各地的新闻来源,向用户进行个性化推荐。同时BuzzFeed、[6]DailyMeInc.[7]等专业从事订制新闻聚合服务的提供商也快速成长。《纽约时报》《华尔街日报》等传统传媒机构也在数字化浪潮推动下,逐步推出了个性化订制新闻[8]。
在门户网站时代,PNR已经进入了快速发展的阶段,但受限于访问终端,PNR的使用场景和用户模型的数据来源还十分有限。移动互联网的发展和普及打破了这种限制,手机从单纯的通信工具变成了人类社会生活不可或缺的一部分[9],极大推动了PNR的发展。同时得益于推荐技术的发展和进步、云计算和大数据带来的算力提升以及3G、4G带来的通信能力的发展,一点资讯、今日头条、Flipboard等以新闻聚合和个性化分发为主要功能的产品抢占了新闻用户的注意力,成为移动互联网新的流量入口。
个性化新闻推荐对传统的新闻生产带来冲击和变革,将新闻生产从“内容本位”转变为“受众本位”,进而将新闻用户逐步带入到新闻生产的中央,重塑了新闻业务链,成为建构注意力市场新的结构性力量。[10]新兴技术与传统新闻价值观念在媒介发展过程中互相碰撞,PNR在发展过程中凸显出一系列问题,如“信息茧房”效应导致的信息窄化、“把关人”缺失导致的信息失序、“搬运工”行为带来的产权纠纷等[11]。二、PNR发展动力
用户的信息需求是PNR发展的原动力,但同时信息技术的推动和新闻商业化催化在其发展过程中也发挥了举足轻重的作用,三者共同构成了PNR发展的主要动力。
(一)信息需求———PNR发展的拉动力量
根据美国信息学家科亨(Kochen)提出的信息需求层次理论,信息需求存在客观状态层次—认识层次—表达层次三个不同层次(详见图1)。[12]其中,表达层次信息需求的满足有赖于用户的表达和媒介服务能力;认识层次信息需求的满足有赖于服务方与用户的互动;客观状态层次需要的满足则对服务方感知用户的能力具有较高的要求。图1用户信息需求层次理论模型
1.客观状态层次信息需求对PNR的影响
客观状态层次的需求是信息用户在一定的社会条件影响下出现的信息需求,这种信息需求状态由客观条件决定,不以信息用户的主观意志为转移。决定这一层次需求的客观因素可以分为宏观环境、微观环境和用户自身属性,是用户所处环境因素与用户自身属性相互作用的结果。
由于移动互联网已经成为新闻传播的主要渠道之一,手机的广泛使用提高了新闻用户的真实性、地域性和交互实时性,今日头条、Flipboard等PNR产品以此为基础,通过将用户所在位置、使用时间等物理环境特征作为变量加入推荐算法,显著提升了推荐系统的准确度。而Facebook则是基于用户所在社交网络的社交环境,通过协同过滤算法提供新闻推荐服务,取得了商业上的巨大成功。[13]
现有产品通过满足用户环境信息对应的客观信息需求所取得的成功,体现了客观信息需求在PNR服务中的重要作用。但显而易见的是,位置、时间甚至是社交等微观环境要素,仅仅是决定用户客观信息需求的诸多因素中的一小部分,更多制度因素、社会文化因素、用户的新闻使用场景和工作任务等决定用户客观需求的要素还无法纳入推荐算法。情境感知、泛在信息环境感知等技术已经有了一些研究成果,但仍然处于基础研究阶段。[14]客观信息需求感知的缺失也成为当前PNR面临的“信息茧房”、信息失序和新闻的公共性、专业性等问题的主要原因。这一方面是由于客观需求决定因素的复杂性及其在数字化方面的技术问题;另一方面,更加全面的感知意味着更多用户数据的获取,这在用户隐私泄露方面存在不可避免的风险,PNR就此陷入“个性化—用户隐私悖论”。
此后,新闻使用行为随着互联网的发展和普及实现了数字化、可计算,算法基础也从用户订制这种主动提供的数据为主,逐渐转变为以信息浏览、跳转、收藏等为代表的用户行为被动记录的数据为主,用户的数据获取过程与信息消费过程实现了统一。用户不再需要通过形式化表达来定义新闻需求,获取用户数据的障碍在不断消除,同时行为数据和属性数据得以整合,分类、聚类、网络挖掘等数据挖掘算法和协同过滤算法在此期间日渐成熟,并逐渐应用于PNR中。
随着网络访问终端的发展,用户数据的获取方式在不断的多样化,数据来源不断拓展。第一次大程度的拓展伴随着Web2.0的出现和发展,Web2.0参与性、协同性、集成性等一系列特征[20]使互联网用户从信息的被动接收者,成为信息生产者,来自用户的内容为PNR的推荐精准化提升奠定了内容基础,同时,自然语言处理技术和语义网技术又为用户内容的理解提供了保障,基于内容和标签的推荐算法得以迅速发展[21]。
社交网络应用再次拓展了PNR数据来源,PNR用户数据从行为数据、内容数据拓展到用户的社交网络数据,作为用户环境数据的一部分逐步应用到PNR中,基于用户社交网络数据的新闻推荐逐渐成为PNR的主流算法思想[22],并在Facebook等产品中获得成功。
移动互联网与人类社会生活的深度融合,泛在信息环境的不断扩大,进一步拓展了用户数据获取的范围,基于情境的推荐技术成为PNR的技术前沿[23],PNR服务的基础向用户环境数据进一步深入,在用户模型和用户信息需求场景方面更进一步,也成为未来研究的热点方向。
4.大数据、云计算技术提供了基础设施保障
移动互联网数据接入技术的不断升级,使得互联网数据量急剧增长,最近5年,移动互联网接入流量每年都以超过100%的速度增长。根据IDC2018年发布的报告,全球每年产生的数据将从2018年的33ZB增长到175ZB,相当于每天产生491EB的数据。[24]以今日头条为例,截至2018年,今日头条每日数据处理量超过50PB、存储数据超过1500PB、评论系统每天的评论数大概有1亿条,在2017年年初,已通过部署17万台服务器来支撑其业务。[25]
作为以数据计算为基础的服务,PNR面临着海量数据快速增长带来的巨大挑战,云计算技术和大数据处理技术成为PNR重要的基础设施。与此同时,由于云计算的超大规模以及分布式处理架构等特点,将传统的推荐技术直接应用到云计算环境时会面临推荐精度低、推荐时间延长以及网络开销大等问题,导致推荐性能急剧下降[26],这一挑战又反过来促使推荐技术的进步和发展。在推荐算法与云计算、大数据技术的互动过程中,PNR逐步实现了分布式计算、基于全样本的模型拟合及实时更新,进一步提升了PNR的智能化程度、用户体验和推荐精度。
(三)产业化———PNR发展的催化力量
PNR作为新兴的新闻服务形式,改变了传统媒体的资源配置模式和传受关系,成为吸引受众碎片化注意力的有效方式,进而成为建构注意力市场的新结构性力量[27],PNR商业化应用和产业化发展催化了PNR的快速发展。
1.产业化促使PNR迅速普及
新闻媒介具有特定的产业属性,在PNR出现以前,国内外新闻传播已经形成了成熟的产业结构,传媒作为一种市场形态,其本身就是在信息需求促使下产生规律作用的结果,这为PNR的快速发展奠定了产业基础和用户基础。当PNR出现后,由于其更加符合用户的信息需求,因而快速以市场化形态出现,在市场主体推动下迅速普及,逐步成长为传媒产业中独特的产业形态,并依靠其对用户需求的快速分析、计算并满足,成长为主流的新闻产品形态。
2.产业化促使PNR形成信息生态
PNR多以技术型而非媒体型企业起步并为人所熟知,PNR本身并不产生内容,必须有优质的内容来源。因此,对于PNR来说,其发展需要信息生态作为土壤,这一生态至少包含新闻生产者、新闻用户和新闻传播者,前两个生态角色已经随着传媒产业的成熟稳定存在,PNR则扮演了新闻个性化分发和精准传播的角色,并且随着PNR的不断发展,产权问题和内容来源问题日益突出,PNR运维主体也逐渐出现角色多元化,在扮演好传播者角色的同时,也利用其技术优势和资本渠道,通过搭建平台,构建起一个自主可控的信息生态,从百度到微博、微信,到今日头条、一点资讯,无不经历着从传播者到生态构建者的发展历程。PNR在媒体产业化构建的信息生态中成长,在发展过程中反作用于信息生态,并重构了信息生态,进而催化了PNR的快速发展。
3.产业化促使PNR可持续增长
移动互联网已经成为新闻用户的主要资讯渠道。PNR企业通过广告、面向第三方的流量输出以及付费服务等盈利模式,实现了用户流量的变现。为了维持竞争优势,PNR企业在内容来源和技术能力方面进行再投资,以不断吸引优质内容创作者,并提高内容分发技术水平。同时,由于PNR的快速发展及其对传统媒介形态的巨大冲击,新的传播、技术和管理等问题也不断显现,PNR企业主动开始谋求与政、学、研的合作,例如腾讯与北京大学的合作[28]、一点资讯与南京大学的合作等[29],这些举措客观上促进了PNR信息生态的良性运行,在多方共同努力下,网络新闻行业管理成效逐渐显现,内容生产效率得到显著提升。三、PNR未来发展趋势
PNR赖以发展的信息技术和新兴产业正在发生着日新月异的变革,数据技术、智能技术的进步以及服务模式的革新促使PNR在服务质量、服务形态和服务内容方面快速发展。
(一)PNR数据广泛融合
PNR的主要功能是向新闻用户提供定制化内容,出于盈利需求,PNR不可避免地会与其他互联网服务进行融合。PNR企业通过研发多元化信息产品、与其他互联网企业的产品合作或者是通过资本推动战略合作等形式,新闻推荐与其他互联网产品和服务的推荐实现了绑定,如澎湃新闻推出的“海贝商城”阅读奖励项目,今日头条推出的“值點”电商项目,这种绑定的背后是围绕移动互联网用户数据的深度融合,这种融合的趋势已十分明显,并且正在加快,多元数据融合实现了更加精准的用户画像。
5G的普及将使“万物互联”成为现实。根据ABI Research估计,从2017年到2022年,可穿戴设备的年复合增长率将达到16.4%,发货量从2017年的2.03亿件,到2022年的4.34亿件[30]。用户数据终端将从PC和手机拓展到更多智能化电子设备,线上和线下的边界将被进一步打破,PNR用户将作为数字化单元融入智能社会,泛在信息环境将从理念和实验室走向现实和商业化。更加深入的用户了解,将使PNR更全面感知用户信息环境,情境感知技术将在数据来源的拓展以及传输和计算能力提升的基础上得以快速发展,用户客观状态信息需求得以更全面的满足,新闻内容将根据用户的主观和客观需求实现无限细分,从而有望从技术角度解决当前PNR信息窄化及其在公共性和专业性等方面问题,新闻传播将从大众传播到分众传播到群体传播,再到真正意义上的个性化传播。
(二)PNR服务更加精准
在云计算、大数据和网络技术日趋成熟的情况下,数据的计算、存储和传输等人工智能发展的基础设施逐渐完善,数据来源成为人工智能发展最核心的要素,数据渠道的拓宽和多元数据的融合将加速智能化技术的进步。
首先是PNR前端的新闻生产环节的全面智能化。当前,媒体智能化变革进程正在不断加快,新华社的媒体大脑、《人民日报》的“中央厨房”、美联社的智能写作机器人、《纽约时报》的Blossomblot等人工智能产品已投入到实际新闻业务中,并在加快重塑新闻业务链。从新闻线索的发现到内容组织编辑,从传播报道到反馈评价,人工智能将全面覆盖新闻业务链。人工智能助力下的人机协同将成为主流的新闻生产方式,媒体智能化的普及将极大提升新闻生产效率和质量,成为媒体变革的核心推动力。其次,新闻生产模式也将在人工智能的推动下发生变革,内容生产将实现按需定制。用户主观和客观需求的全面感知,为PNR实现按需定制提供了数据基础,PNR个性化分发的逻辑也将从传播环节提前到生产环节,新闻的定题、生产将更加具有针对性,其传播效率和传播效果也将更有保障。再次,生产模式的变革和新闻业务链的重塑将根据新闻用户需求实现新闻内容的无限细分,更加细粒度的内容划分将实现更为精准的个性化传播。
(三)PNR使用场景更加多元
通信技术、人工智能技术和数字版权技术将推动媒介加快融合,媒介成为人类更多功能的延伸,不同媒介之间由于融合的加速而使相互之间的边界更加模糊。同时,媒体业务不断拓宽,新闻的媒介渠道将从集中化走向泛在化,用户将不再主要依赖手机读、听、看新闻,PNR服务终端将根据用户的使用习惯向更加多元化的方向发展,同时虚拟现实和增强现实技术也不断提升PNR用户体验,PNR的使用场景也将随之更加多样。
(四)从内容对接到全面对接
媒体融合正在不断推进宣传与服务功能的整合,服务功能也将成为媒体智能化的必备功能[31]。数据的融合将推动PNR的功能和价值从传播向服务渗透,PNR在精准提供新闻内容的基础上,针对用户个性化需求将提供包括教育、医疗、政务、社交、电子商务等一系列线上个性化服务,实现用户与新闻生产者、服务提供者、产品生产者的精准对接,进而成为各种类型服务和商品的入口。这种趋势反过来将为PNR提供更加完善的用户画像,以提供更加精准的个性化新闻内容,从而实现信息生态的良性运转和循环跃迁。
(五)“个性化—隐私悖论”问题越发凸显
丰富的数据终端和多元的数据融合为个性化服务带来了数据驱动力,但同时,用户数据的暴露也面临更大的隐私风险,“个性化—隐私悖论”(Personalization-PrivacyParadox)将越发凸显。由于用户数据是驱动PNR不断进步的核心動力,这在根本上导致了个性化与隐私存在不可调和的矛盾,数据安全技术的不断进步在解决这一矛盾所带来的问题方面可以发挥一定作用,但是更多需要从法律法规、制度设计等方面进行规范,相关问题的研究也会随着PNR不断发展得以深入。四、总结
用户信息需求、信息技术发展和PNR服务的产业化成为推动PNR发展的三股核心动力,然而技术水平和数据来源的限制,导致客观信息需求在PNR服务中出现缺失,也间接造成了PNR发展过程中出现的一系列问题。移动互联网技术、感知和推荐技术、大数据和云计算等技术的发展,将继续推动更加广泛的数据融合和推荐技术的进步,提升推荐系统对用户环境的感知,进而满足用户客观信息需求,为解决PNR当前存在的问题不断提供技术方案,促进PNR生态良性发展。
[本文为国家自然科学基金重点项目“新媒体发展管理理论与政策研究”(71633001)的部分成果]
参考文献:
[1]极光.2019年新闻资讯行业研究报告[R].深圳:2020.
[2]NEGROPONTE N.Toward a Theory of Architecture Machines[J].Journal of Architectural Education(1947-1974),1969,23(2):9-12.
[3]NEGROPONTE N.数字化生存[M].胡泳,范海燕,译.海口:海南出版社,1996.
[4]CHESNAIS P R,MUCKLO M J,SHEENA J A.The FishwrapPersonalized News System:IEEE,1995.
[5]柯青.基于RSS技术的个性化信息服务新方式:由雅虎看RSS在搜索引擎中的应用[J].情报理论与实践,2005(5):537-541.
[6]王斌,李峰.平台型媒体的运营模式分析:以新闻聚合网站Buzz Fed为例[J].新闻战线,2015(15):52-55.
[7]DAILYMEI.DailyMeLaunchesNewUser-CentricNews Destination[Z].NewYork:BusinessWire,Inc,2008.
[8]曾海芳.美国报业的数字化发展研究[D].上海:上海大学,2011.
[9]谢新洲.新媒体给社会生活带来巨大变革社会网络化信息数字化交互实时化[J].新闻传播,2015(22):1.
[10]国秋华.个性化新闻推荐对注意力市场的建构[J].出版发行研究,2019(2):62-65.
[11]王卓轩.基于受众视角看个性化新闻推荐[J].中国报业,2019(6):14-15.
[12]胡昌平.信息服务与用户[M].武汉:武汉大学出版社,2008.
[13]HOEFFLINGERMIKE.回归商业常识[M].黄延峰,译.北京:中信出版集团,2019.
[14]RENY,CHICR,ZHANGJT.AReviewofContext-BasedPersonalizedRecommendationResearch [M]//XuZ,ChooK,DehghantanhaA,etal.AdvancesinIntelligentSystems andComputing.CHAM:SPRINGERINTERNATIONALPUBLISHINGAG,2020:1222-1227.
[15]文军,张思峰,李涛柱.移动互联网技术发展现状及趋势综述[J].通信技术,2014,47(9):977-984.
[16]中国互联网络信息中心.中国互联网络发展状况统计报告[R].北京:2020.
[17]新浪微博数据中心.2018微博用户发展报告[R].北京:新浪微博数据中心,2019.
[18]中国互联网络信息中心.中国互联网络发展状况统计报告[R].北京:中国互联网络信息中心,2014.
[19]中国互联网络信息中心.中国手机网民娱乐行为报告[R].北京:中国互联网络信息中心,2013.
[20]王伟军,孙晶.Web2.0的研究与应用综述[J].情报科学,2007(12):1907-1913.
[21]刘甲学.Web2.0环境下个性化信息服务探析[J].情报科学,2008(09):1336-1339.
[22]ZHOUX,XUY,LIY,etal.TheState-Of-The-ArtIn PersonalizedRecommenderSystemsForSocialNetworking [J]. ARTIFICIALINTELLIGENCEREVIEW,2012,37(2):119-132.
[23]OMARCOLOMBO -MENDOZAL,VALENCIA -GARCIA R,RODRIGUEZ-GONZALEZA,etal.Recommetz:AContext-Aware Knowledge -BasedMobileRecommenderSystemForMovie Showtimes[J].EXPERTSYSTEMSWITHAPPLICATIONS,2015,42(3):1202-1222.
[24]REINSELD,GANTZJ,RYDNINGJ.DataAge2025-TheDigitizationoftheWorldFromEdgetoCore[EB/OL].[2020-02-25].https://www.seagate.com/files/www-content/our-story/trend s/files/idc-seagate-dataage-whitepaper.pdf.
[25]雷鋒网.今日头条超大数据中心亮相,与英特尔共同发力AI与大数据[EB/OL].[2020-3-6].www.sohu.com/a/255020949_114877.
[26]朱夏,宋爱波,东方,等.云计算环境下基于协同过滤的个性化推荐机制[J].计算机研究与发展,2014,51(10):2255-2269.
[27]国秋华.个性化新闻推荐对注意力市场的建构[J].出版发行研究,2019(2):62-65.
[28]腾讯大数据.腾讯公司与北京大学共建协同创新实验室[EB/ OL].[2020-2-26].https://cloud.tencent.com/developer/article/1031103.
[29]冯栋.自媒体“火种”播撒高校一点资讯“百校万人计划”落地南京大学[EB/OL].[2020-3-6].http://www.xinhuanet.com/itown/2017-11/ 09/c_136739321.htm.
[30]王宇峰,余珞,MUDESIRABDURAZAK,等.5G时代十大应用场景白皮书[R].深圳:华为技术有限公司,2017.
[31]谢新洲.县级融媒体中心建设的四梁八柱:融合、创新、引导、服务[J].新闻战线,2019(3):45-47.
(谢新洲为北京大学新媒体研究院院长,教授,博士生导师;王强为北京大学新媒体研究院博士生,北京市科学技术情报研究所副研究员)
编校:董方晓