校园社交平台中标签系统的研究
虞得贤 李强 王锦涛
摘要:标签系统作为信息过滤的重要工具,已经广泛运用于生活中。文章提出了一种运用于校园社交平台的标签系统,用来描述自身的兴趣,并基于标签系统进行信息流推荐,为大学生在校园内形成依托于自身兴趣的社交囤,寻找志同道合的朋友提供了可能。
关键词:标签系统;推荐算法;校园社交平台
随着Web2.0技术的兴起与发展,互联网从信息传播的媒介逐渐转变为信息资源共享和社会交流的平台,社交网络的发展和壮大给人们的生活带来了巨大的影响。然而,网络的普及和发展也带来了数据量的飞速增长,社交平台中经常出现与自身兴趣无关的内容。因此,如何从海量信息中准确地找到感兴趣的内容显得尤为突出。
另一方面,大学生进入大学校园之后,渴望能够拓展新的社交网络,能够寻找志同道合的朋友,发掘自己的兴趣所在。大学生社交圈通常比较局限,主要是通过班级、学生组织和社团等强关系,很难接触到校园内其他可能感兴趣的人、事、物。使用传统校园社交平台的时候,由于用户之间缺乏直观认识,难以直接与自己有相同兴趣的人建立社交联系,从而使得社交复杂化和表层化。
文章提出了一种运用于校园社交平台的标签系统,实现了高效的校园需求信息连接匹配,为大学生们快速准确地检索到所需信息提供了一种新的可能,使社交平台满足大学生基于兴趣的个性化社交需求。标签系统可以动态地捕捉用户的兴趣,并且通过标签,既反映用户兴趣取向,又反映了资源本身的特征属性,使得标签成为连接用户与用户,用户与资源的桥梁,使个性化推荐更加准确、快捷。用户通过标签系统获得真正感兴趣的内容,有效地节约了时间成本,满足了用户寻找共同兴趣的人、事、物的需求。
1 相关研究
标签是一个有意义的片段,具有信息量,是用来描述信息的关键词,可以被用户理解和使用。社会化标签系统中,标签是利用普通用户提供的关键词进行信息组织的一种新兴方法。标签系统已经广泛地应用于人们的生活中,很多网站凭借它取得了巨大的成功。标签系统主要运用于管理个人信息、社会化书签标注、数字媒体的整合分享和提升电子商务体验等方面。其中,标签系统在数字媒体和电子商务的运用尤为突出。
在数字媒体整合分享方面,标签系统用于对数字媒体的标记和收集。这些数字媒体包括照片、视频或者任何其他可以数字化展示的东西。热门视频分享网站YouTube是最早使用标签的网站之一,用户可以为自己上传的视频添加标签,使视频的内容更加直观,便于用户对视频的整理与分享。
在提升电子商务用户体验方面,标签系统用于电商的导购。以淘宝为例,淘宝的商品导航通过标签系统将其商品分隔成层级化的类别;热门的商品以标签的形式出现在商品搜索下方,方便了用户对商品的查找;淘宝卖家为其商品添加标签化的标题以提高买家的关注度和商品被搜索的概率;商品的评论以标签化展示,方便买家快速了解商品的特性,从而提高用户的购物体验。
综上所述,标签系统在各大网站都有着广泛应用,文章所研究的标签系统允许用户自行对信息或资源加上标签,给人们对信息过滤带来了极大的帮助,另外,用户也可以通过标签系统为自身添加标签,用以描述自身的兴趣,使基于标签系统的社交平台的信息流展示更加个性化,推荐更加精准。
2 标签系统建立
文章通过搜狗输入法词库、维基百科等资源,借鉴门户网站的分类导航,整理了大学生校园中可能感兴趣的各个方面,建立了一套分类标签体系,如图1所示。标签体系分为4级,分别称为版块、领域、主题和话题,包括校园生活,兴趣爱好,知识技能三大版块。在三大板块下,又包含情感、学习、工作等19个领域,友情、科研、求职等180个主题和知己、专利、校园宣讲会等5000多个话题。基于此标签体系,构建了标签系统。
为了使标签系统涵盖的话题更加全面,提升用户使用标签系统的体验感,文章提出的标签系统还支持用户自定义标签。如果用户在标签系统中没有找到感兴趣的标签,用户可以自己定义标签。只要自定义标签通过了管理员的审核,就能加入到标签体系中,增加了系统的科学性。
3 校园社交平台中标签系统的用途
大学生群体的兴趣需求存在丰富的多样性,他们不满足于单一地依靠人与人联系的“强关系”社交所带来的社交连接,更希望能够在大学校园内形成依托于自身兴趣的“弱关系”社交连接。标签系统的运用使得校园社交平台能够精准匹配不同大学生的兴趣需求。
用户通过标签系统可以为自身添加标签,用户的个性化标签是对自身兴趣的一种描述方式,使其他用户对自身的认识更加直观,增强用户的个性化特征,从而更好地为用户提供个性化服务。用户可以自主地给自己添加标签来表明自己的兴趣爱好,也可以为发的帖子来添加标签,便于与他人分享。标签系统使得对用户兴趣的挖掘更加便利。基于标签系统为用户推送与自己兴趣爱好相似的用户和自己感兴趣的帖子、活动,不仅有利于在平台中快速找到志同道合的好友,还为用户从海量信息中找出自己真正感兴趣的内容,提升了推送内容的准确性。
4 基于标签系统的推荐算法
结合常用的推荐算法,文章提出了两种基于标签系统的推荐算法用于校园社交平台中:一种把标签系统与基于内容的推荐算法相结合,使得校园社交平台能为用户提供个性化信息流;另一种则结合协同过滤推荐算法,为用户寻找可能感兴趣的人,发现身边热门的事情。
基于内容的推荐算法是信息过滤技术的延续与发展,它不需要了解用户对项目的评价,是根据项目的内容属性的相似性作出推荐的。结合标签系统,不仅根据用户添加的标签为用户推荐含有此标签的帖子、活动,还为用户推荐含有与此标签相似度高的标签的帖子、活动。根据标签系统,处于同一层级且父级相同的标签认为与此标签相似度最高,含有这类标签的帖子、活动的内容与已知用户感兴趣内容的相似度也最高,最可能符合用户的兴趣。从而在过滤无用信息的同时,发掘用户潜在的兴趣,使得信息流的推荐更具新鲜感。
协同过滤推荐算法是推荐系统中被认为是最有前途的个性化推荐技术之一。根据不同用户对项目的评分数据来预测用户的相似性,通过相似用户的偏好信息产生对目标用户的推荐。它的依据是任何人都不是孤立的,都有自己的社交圈,都应该处在某个兴趣相同的群体之中,如果用户具有共同的兴趣,那么这些用户对不同项目的评分应该比较相似,其他用户感兴趣的当前用户很有可能也感兴趣。基于协同过滤的推荐算法考虑用户的行为来进行相应推荐的,充分运用了集体智慧,考虑了用户的历史习惯,使推荐的个性化程度更加高。把协同过滤推荐算法与标签系统相结合,大大简化了对用户兴趣模型的建模。通过标签系统,可以获知不同用户的偏好信息。不同用户间具有的共同标签即共同的兴趣点,从而可以有效地分析出用户间的相似性,社交平台为用户推荐感兴趣的人也更加精确。与用户具有共同标签的用户群体中的热门话题更能符合用户的兴趣,使得热门话题的推荐更具人性化。
5 结语
文章根据标签的特性,建立了一套运用于校园社交平台的标签系统。通过标签系统,挖掘用户兴趣并对信息进行过滤。另外,运用推荐算法结合标签系统,文章提出了两种基于标签系统的推荐算法,使得校园社交平台更能满足用户基于兴趣的个性化社交的需求。