基于标签的个性化信息服务研究

    李中慧

    

    摘要:标签(Tag)是一种灵活、有趣的日志分类方式,具有社会化、人性化、随意性等特点,可以为每篇日志添加一个或多个标签,根据所注标签聚合具有相似性的资源。文章通过引入聚类分析,推测用户兴趣偏好,构建用户兴趣模型,从而构建基于Tag的用户个性化信息服务流程框架。

    关键词:社会化标签;个性化信息服务;用户兴趣模型

    1基本理论

    对于标签(Tag)这个概念,不同学者给出不同的界定。Tag学者刘炜认为:Folksonomy(分众分类)由Tag组成;Tag在Folksonomy中是微资源的指代;通过检出Tag而检出微资源;Tag云图反应了Tag的权重,在此论述中,作者从元数据角度描述了Tag及其与Folksonomy的关系,即Tag是Folksonomy的表现形式。Tag作为一种新型在线信息的组织和管理方式,它不同于传统的关键字检索,并非只针对于文本,而是公众化、智能化的分类方式。

    1.1标签的特点

    (1)社会化:以人为中心进行各类标签的标记。

    (2)聚合性:所设置的每个标签都是对资源的总结概括,因此同样的标签所聚合出的资源和用户也是相同的。

    (3)自适性:受关注度高的资源和标签会随着社会的发展和公众兴趣的转变而不断变化,Tag能够动态地适应用户在不同时期对各类资源的需要进行智能化标记。

    (4)以人为本:Tag类似于关键词标记,又不同于一般的关键词,它更贴近网络用户的个人感受及情感体验,贴近生活地进行标记与查找。

    1.2标签的应用

    (1)个人知识管理。用户阅读文献、收藏资源时,往往通过添加标签来描述资源,方便再次标引和检索。

    (2)对网络资源分类。社会化标签提供的分类方式是非结构化的,相比传统分类方式,标签更能动态地适应网络资源的组织。

    (3)信息检索。标签是更随意、贴近用户的关键词,不同的用户可以根据自己的体验用不同的标签标引资源,便于信息检索。

    (4)构建网络词表。Web2.0环境下,用户协同内容创作是信息生成新的发展方向,标签作为Web 2.0的产物,能够动态适应用户需求构建网络词汇表,用来标引与检索。

    2.2用户模型的表示

    文章中用户模型的表示通过加权树形结构和频繁项集表共同完成,加权树形结构是用户模型表示的基本模型,也是根据加权树形结构来确定标签的权值。该加权树形结构的顶层是一个并没有实际意义的用户模型标识节点,下一层是特定的主题域知识,最初每位用户用户主题域的所有知识,通过层层深入下一层各概念知识的学习,调整权值,用户的主题域知识初始权值为0。加权树形结构中,每向下划分一层都有一个相应的权值,文章就是通过结合特定的主题域知识中对不同概念的不同权值进行计算,来表征用户信息需求模型。

    2.3个性化信息推荐服务的实现

    在实现基于标签的个性化信息推荐服务时,对标签的选取是个严格的过程,所选的标签必须能够反映所标注资源的内容特征,同时能够体现出较为稳定的用户兴趣。一般对用户进行信息推荐时,会遇到两种情况:

    (1)已经被贴上标签(tag)的文档。对于此类文档,我们需要将标签与频繁项集进行对照,重合的词条越多,说明该标签与词条越相关,越被优先推荐;接下来扫描加权树,重合越多的词条权重越大,越优先推送。

    (2)从未被标注的文档。对于这类文档,就不能遵循上述步骤,需要判断该标签属于哪个主题域,然后根据该主题域的权重分析标签的推荐次序,最后在主题域内根据已知各概念的权重决定推送的次序。

    3基于社会化标签的个性化信息服务流程

    3.1相似用户发现

    构建好用户兴趣模型后,根据用户模型来对用户的相似性进行计算,并按照一定的顺序排列,从而寻找最相似最近的邻居。当用户被圈入相似用户集后,则说明相似集中的用户在某些方面具有相同的兴趣爱好,从而可以向目标用户推荐共同兴趣的邻居用户。

    3.2资源集的确定

    确定了相似用户集后,就是确定了用户的相同兴趣,此时可将这些相似用户共同收藏、发表或编辑的资源作为其资源集,便于通过相似用户资源集纳入更多的邻居用户。

    3.3资源特征表示

    一旦确定相似用户资源集,则可以聚合用户资源集中所有资源的特征,采用基于标签的空间向量法对资源特征进行表示。

    3.4模型匹配运算

    模型的匹配运算主要是对用户兴趣的主题向量和资源特征向量两个模型进行匹配,计算两个向量的相似度,也就是计算出用户兴趣模型和资源集的匹配程度,当获得准确的匹配程度值也就能够具有针对性的对用户进行个性化信息推荐。

    4结语

    文章对标签的基本概念、特点及应用进行了介绍,同时对个性化信息服务的流程也做了简单的分析,但是由于个性化服务系统的复杂性,并没有得出一个智能的个性化信息服务程序,再加上研究时间和条件的局限,对系统的控制维护方面没有进行探究,这些问题都需要今后做进一步研究。

相关文章!
  • 融合正向建模与反求计算的车用

    崔庆佳 周兵 吴晓建 李宁 曾凡沂<br />
    摘 要:针对减振器调试过程中工程师凭借经验调试耗时耗力等局限性,引入反求的思想,开展了

  • 浅谈高校多媒体教育技术的应用

    聂森摘要:在科学技术蓬勃发展的今天,我国教育领域改革之中也逐渐引用了先进技术,如多媒体技术、网络技术等,对于提高教育教学水平有很

  • 卫星天线过顶盲区时机分析

    晁宁+罗晓英+杨新龙<br />
    摘 要: 分析直角坐标框架结构平台和极坐标框架平台结构星载天线在各自盲区状态区域附近的发散问题。通过建