标题 | 基于读者个性化特征数据挖掘的图书馆书目推荐 |
范文 | 谢康 摘 要: 传统图书馆服务缺乏个性化设置,无法充分利用资源进行准确书目推荐,为了改善这一问题,提出基于读者个性化特征数据挖掘的图书馆书目推荐系统。根据读者类聚特点与数据关联规则,设计节目个性化推荐系统,并将挖掘出的关联规则应用到推荐服务当中;根据挖掘流程可得到大量数据,并对多余数据进行清理,不完整数据进行补充,计算支持度和置信度;采用基于读者个性化特征数据挖掘图书馆书目并进行推荐,由此完成图书馆书目推荐。通过实验分析可知,该推荐方法可充分利用图书馆资源,快速、准确完成书目推荐。 关键词: 图书馆服务; 个性化特征; 数据关联规则; 数据挖掘; 图书馆书目; 书目推荐 中图分类号: TN911?34; TP311.13 文献标识码: A 文章编号: 1004?373X(2018)06?0034?03 Abstract: The traditional library service lacks personalized setting, and cannot make full use of resources to conduct catalogue recommendation accurately. To resolve this problem, library catalogue recommendation based on readers′ personalized feature data mining is proposed. According to reader clustering characteristics and data association rules, a personalized program recommendation system is designed, and the mined association rules are applied to recommendation service. A large amount of data can be obtained according to the mining process, with redundant data cleaned and incomplete data supplemented, so as to calculate the support degree and confidence coefficient. Readers′ personalized feature data is used to mine and recommend library catalogue, so as to complete library catalogue recommendation. The experimental analysis shows that this recommendation method can make full use of library resources and complete catalogue recommendation quickly and accurately. Keywords: library service; personalized feature; data association rule; data mining; library catalogue; catalogue recommendation 0 引 言 高校图书馆中应用数据库技术促使系统硬件与软件都得到改善,每天都会更新资源,学生和教师等读者对资源也会充分利用,这就使图书馆数据库中积累大量的历史信息。图书馆是面向全校读者所提供的一个方便快捷查找资料的场所,但是随着读者对图书馆资料查询要求不断提高,从资源中准确筛选读者需要的图书信息成为了当务之急[1]。 传统图书馆服务缺乏个性化设置,无法充分利用资源,为了改善这一问题,提出基于读者个性化特征数据挖掘的图书馆书目推荐。其利用数据挖掘技术对图书馆数据库中的海量借阅信息进行挖掘,可找到其中隐藏的关联规则,根据这些规则可帮助图书馆完成个性化信息推荐工作,也为读者提供了良好服务。 1 图书馆书目推荐特征数据挖掘算法的实施 根据读者类聚特点与数据关联规则,在图书馆传统管理系统基础上,设计基于读者个性化数据挖掘的信息服务系统[2?3],如图1所示,针对数据与处理模块和数据挖掘模块进行详细分析。 基于读者个性化特征数据挖掘的图书馆书目推荐系统主要能实现以下两个方面能力:一是数据挖掘,首先对图书馆读者进行调查,并根据借阅数据信息进行聚类群分,根据聚类群体中读者借阅的数据信息完成数据关联规则挖掘;二是个性化推荐,将挖掘出的关联规则应用到推荐服务当中[4?5],该系统是基于Windows XP上運行的,并采用B/S模式,而前台使用Visual Studio 2008集成环境,将Visual C++作为开发工具,后台使用SQL Server 2008数据库来保存用户数据[1]。 2 基于读者个性化特征数据挖掘书目推荐算法 2.1 读者个性化特征数据挖掘 数据挖掘中最常用的方法是对个性化关联规则展开分析,利用该规则对图书馆书目进行推荐,具体算法如下: 书目推荐算法通常采用项集合x和y来表示,两个项集合是相互独立的,且不具有重复属性[6],可表示为:[x?y=?]。集合x和y之间的个性化规则需满足如下条件:两项集合有用并且集合之间个性化规则具有一定普遍性和有趣性。比如:[T=T1,T2,…,Tm]是项的集合,相关数据[D]是数据库信息的集合,其中每条信息d是项的集合[7],使得[d?1]。每条信息具有一个标志符号,称为[d1]。设a是一个项集,信息d所包含的a当且仅当[a∈d]。个性化关联规则具有[a?b]蕴涵式,其中[a?1,b?1],并且[a?b=?]。 2.2 书目推荐算法 如果个性化关联规则[a?b]在信息集合[D]中成立,具有特征属性支持度s,信息集合[D]中包含[a?b]的百分比也被称为支持度,即为[pa?b]。 如果个性化关联规则[a?b]在信息集合[D]中成立,具有置信度c,信息集合[D]中包含信息a的同时也包含b的全部信息比,也被称为置信度[8?9],即为[pba]。可具体表示为: [Supporta?b=pa?bConfidencea?b=pba] 通常情况下,特征数据挖掘是在基于读者个性化关联规则基础上实现的,该挖掘主要分成两个部分:一部分是将找到的所有与关联规则有关项集进行统计;另一部分是在上一部分产生项集基础上进行强关联规则分析[10]。在挖掘过程中,中心问题是要进行高效频繁项集搜索,如果效率较低,那么每次所产生的候选项会导致算法在运行过程中需要进行一次数据库扫描,所耗费工作量较大,为此利用个性化关联规则进行繁琐项集搜索。繁琐项集搜索完成后,会产生强大的关联规则,如果项目集中每一个频繁项目集为1,那么就会产生1个非空子集;如果项目集为非空子集,且满足大于等于最小置信度的条件,则该子集可输出作为书目推荐。 3 实 验 3.1 实验参数设置 为了验证基于读者个性化特征数据挖掘的图书馆书目推荐方法合理性,使用科学试验和技巧与程序的调试方法进行相关数据收集,设计实验并进行验证,分析个性化推荐数据挖掘算法的使用效果与准确度。实验开发环境设置如下:处理器为[Intel?][CoreTM i5-4590CPU @3.30 GHz;]内存为32.0 GB;系统种类为[Windows 10,]64位操作系统,使用64位的处理器。 3.2 实验结果与分析 选举6位阅读者所借阅5本图书为例,假设学生编号为[PZ],书目借阅信息为[Tx],具体数据如表1所示。 将传统书目推荐方法与本文使用的推荐方法在最小置信度阈值为70%的情况下,对书目推荐准确率进行对比,结果如图2所示。 由图2可知,当读者借阅了T1和T5,传统方法推荐书目为T1,而正确推荐书目应该为T2;当读者借阅了T2和T5,传统方法推荐书目为T2,而正确推荐书目应该为T1;当读者借阅了T5,传统方法推荐书目为T1和T2,与正确推荐书目一致。由此可知,当最小置信度阈值为70%,传统方法对书目推荐准确率小于本文使用的方法。 将传统书目推荐方法与本文使用的推荐方法在最小置信度阈值为50%的情况下,对书目推荐准确率进行对比,结果如图3所示。 由图3可知,当读者借阅了T1和T2,传统方法推荐书目为T2,而正确推荐书目应该为T3;当读者借阅了T1和T3,传统方法推荐书目为T2,与正确推荐书目一致;当读者借阅了T2和T3,传统方法推荐书目为T3,而正确推荐书目应该为T1。由此可知,当最小置信度阈值为50%,传统方法对书目推荐准确率小于本文使用的方法。 4 结 语 由于图书馆书目推荐工作意义繁重,利用基于读者个性化特征数据挖掘中的关联规则,根据历史记录,可方便为读者推荐感兴趣书目。图书馆可通过数据挖掘将珍藏的图书推荐给阅读者,使读者快速寻找到自己感兴趣书目,具有省时、高效特征,采用该推荐方法能满足不同借阅者个性化需求,具有一定真实性。 参考文献 [1] 周欣,陆康.基于图书馆数字资源访问系统的读者行为数据挖掘研究[J].现代情报,2016,36(1):51?56. ZHOU Xin, LU Kang. Data mining on reader behaviors based on library digital resource system [J]. Modern information, 2016, 36(1): 51?56. [2] 何胜,冯新翎,武群辉,等.基于用户行为建模和大数据挖掘的图书馆个性化服务研究[J].图书情报工作,2017,61(1):40?46. HE Sheng, FENG Xinling, WU Qunhui, et al. Research on personalized services of library based on user behavior modeling and big data mining [J]. Library and information service, 2017, 61(1): 40?46. [3] 陈臣.基于大数据挖掘与知识发现的智慧图书馆构建[J].现代情报,2017,37(8):85?91. CHEN Chen. Construction of smart library based on the big data mining and knowledge discovery [J]. Modern information, 2017, 37(8): 85?91. [4] 韩雪飞,丁玉东,杜瑾.高校毕业季图书馆开展读者数据留存活动调查与建议[J].图书情报工作,2015,59(20):77?82. HAN Xuefei, DING Yudong, DU Jin. Investigation and suggestion on readers′ date retention activities in the graduation season in university libraries [J]. Library and information service, 2015, 59(20): 77?82. |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。