标题 | 多维应用关联的高校智慧图书馆研究与实践 |
范文 | 刘慧 摘 要 高校图书馆与各部门服务对象的一致性,使得图书馆获取读者需求渠道具备了多源性。多源应用的支持让智慧图书馆更加“智慧”。论文以“I晓庄”为例对高校的多源应用进行归纳,提出了高校智慧图书馆的多源应用支持的必要性,同时构建了一套以多源应用支持的智慧图书馆模型来挖掘读者兴趣。 关键词 多源数据 高校图书馆 智慧图书馆 分类号 G252.6 DOI 10.16810/j.cnki.1672-514X.2017.12.012 Abstract The consistency of the service objects between the university library and the various departments makes the library obtain the readers demands with multiple sources. The support of the application with multiple sources makes the smart library more intelligent. Taking the “I Xiaozhuang” as an example, this paper summarizes the application with multiple sources in universities, and puts forward the necessity of smart university library supporting the application with multiple sources.It also builds a smart library model supportedby the application with multiple sources to mine the library readers interest. Keywords Multi-source data. University library. Smart library. 技术创新改变生活,生活的需求促进创新,两者相辅相成。图书馆的智慧服务以及未来的智慧图书馆建设,不能够只限于图书馆所拥有的“单维”数据,而应该是多维数据支持下的决策体系,这样才能够更加全面、真实地反映读者的需求。多维数据的汇聚、整合、挖掘与分析,将是数据服务的基础工作,也是业务拓展的依据。智慧图书馆的数据决策也不再仅限于业务,而应该逐步走向数据分享阶段,以共建共享的方式来逐步完善自身数据库的建设。因此,本文从“智慧”角度,探索高校多源应用与图书馆的数据融合,多维度探测读者的资源与服务需求,为图书馆的运营提供真实与可靠的决策数据,以提高图书馆的运营效率,降低运营成本。 1 多维关联的“智慧”体系 1.1 “智慧”的数据支持 图书馆以及与读者相关应用系统的数据支持是“智慧”发挥的重要基础。由于高校的网络环境与多系统的异构特性,数据融合的复杂程度较高。数据的统一转换是解决异构系统之间壁垒的有效方法之一[1]。淘宝、京东等商业营销系统,营销的精准性都通过用户行为数据支持。数据的维度越多,其精确度相对越高。智慧图书馆的实现,需要精确的数据支持。高校环境下,多源应用数据的融合,让高校图书馆更加“智慧”,服务定位更加精确,资源推送更加准确。为了克服数据的稀疏性等问题,统一对象的多源数据的汇聚、挖掘与分析是“智慧”具备全面性、完整性、代表性等特性的途径与方法。 1.2 “智慧”的信息推送 动态信息服务,是高校图书馆的营销服务方法之一。然而长期以来,高校对读者群体没有进行有效的管理分类,读者需求没有数据支持,造成信息服务效果不明显。嵌入式推荐服务模式[2],通过对推荐对象、推荐内容的精确划分,能够保证“智慧”推送的效果。数据的采集、分析、挖掘目的是获取读者资源与服务需求,其结果的反馈就是资源与服务的推送,所以“智慧”的推送是以数据定位、读者分类管理为基础,其直接影响到推送的精确性。协同过滤的推荐系统(collaborative filtering, CF)为用户(读者)推荐与他们有着相似偏好的用户(读者) 所需要的资源[3]。 1.3 “智慧”的精准服务 精准的服务一直是图书馆理想的工作模式。然而读者多样化、动态化的需求,让馆员无法准确把握读者真实想法。首先,人工的動态交流渠道无法面对庞大的读者群体。其次,人工交流体制容易造成理解上的差异。最后,人的精力无法满足全天候的服务机制。即使构建便捷的交流渠道,由于语言与学科背景的差异性,学科馆员与读者之间的思想碰撞难以得到有效的统一。所以,“智慧”的精准服务,需要借助于技术手段实现。Spark等技术为图书馆精准服务提供了可靠的工具。构建与图书馆读者行为相适应的机器学习库MLlib,将是未来图书馆参照阿里巴巴等商业机构进行精准服务的途径。 1.4 “智慧”的体系架构 智慧图书馆的实现,需要构建一套读者行为监测体系,以数据决策方式来实现图书馆业务运营,这一方面能够提升图书馆运营效率,降低运营成本,另一方面能够提高读者的满意度,从而进一步增强读者的忠诚度,提高资源的利用率[4]。“物以类聚,人以群分”(theory of homophily),读者群体的资源需求分类,是智慧感知分析的首要任务。 如图1所示,“智慧”是一个感知与分析的过程,需要多源的数据支持。而感知与分析的结果需要动态并及时地反馈至读者,即资源与服务的信息推送,精准的定向服务乃至具体业务管理的动态调整等。图书馆与读者之间的互动性也是读者服务工作的重点内容。正所谓知己知彼才能够掌控局面,这也正是智慧图书馆感知读者的初衷。 1.5 “智慧”的感知技术 图书馆多源信息融合,存在两个方面的问题,第一,现有的数据融合框架的组件效率不高,第二,数据源不足,必须增加数据源广度,或者深度挖掘有限的数据源。数据采集、挖掘与分析,是“感知”的基础,而数据的准确性、结果的精确性是“智慧”程度高低的标志之一。物联网、人脸识别等技术,也将逐渐引入自助借阅、门禁等服务与空间管理系统,从而提高图书馆服务的效率,提升服务的质量,避免一部分管理矛盾。“智慧”的感知不仅仅是技术的应用,也是图书馆馆员与图情学者“智慧”的结晶。 2 “I晓庄”移动感知应用系统 “I晓庄”移动平台,是一种移动应用门户平台,应用的高度集成性使得大数据分析成为可能。 2.1 学生管理应用 高校图书馆的读者群体中,一般包含学生和教师两个主体,对于图书馆来说学生管理应用包括图书馆的借阅服务应用、电子资源远程访问系统等。而高校图书馆外的其他业务部门学生管理业务包括:迎新、教务、学工、离校管理等系统。对这些系统进行多维数据采集有助于全面分析评估学生的偏好。 2.2 教师管理应用 高校业务系统中,与学生团体相对应的就是教师团体,其也享受着各种业务系统所带来的工作与学习的便利,例如:人事管理系统,工资系统,科研管理系统,教务管理系统和图书馆资源服务等系统的支持。教师的教学与科研工作,对图书馆依赖性较大。高校图书馆的学科服务工作很大程度上就是围绕教学与科研展开的。 2.3 保障服务应用 高校图书馆与高校其他服务部门的服务对象具有高度的一致性。教学、科研与生活等组成的各类保障,构建了智慧的服务保障体系,是提高师生满意度的有效措施。O2O等互动平台的构建,关联了服务部门与服务对象,让用户与相关机构动态互动,提高效率的同时也避免了由于信息不对称造成的问题。高校图书馆也属于其中之一,问题的不及时解决,会让矛盾与问题进一步升级,从而降低读者的满意度与忠诚度。 2.4 多维数据实践 以数据为基础的多系统关联体系的构建,是较好解决异构系统之间不能有效融合的方法。数据的接口开放性与稳定性,是实践达到既定目标的基础。图书馆管理系统、一卡通系统、学工系统、人事系统、财务系统、科研系统等等,数据的有效融合,是多源数据平台成功的关键。“I晓庄”应用平台的构建,其理论基础为多维应用关联体系。读者决策采购(Patron-DrivenAcquisition,PDA) 已经被广泛运用于图书馆采购,其核心就是围绕读者需求开展采购活动[5]。多维数据关联应用的目的就是围绕服务对象需求开展有针对性的服务业务,提高效率,降低成本。 3 智慧图书馆的多维应用关联理论与方法体系 多源异构是大数据的特点之一,多源数据融合是大数据分析的一个重要环节,也是大数据领域的一个重要研究内容[6]。多维应用关联的基础就是多源数据融合。智慧服务与智慧图书馆,其智慧性,体现在数据的完整性与准确性,业务的精确性。高校图书馆的业务由于互联网等外部信息获取途径带来的竞争,也在发生着变化,其业务内容不再局限于传统的文献服务,而是围绕读者需求开展精细化的知识服务,空间服务等。读者行为的动态监测,也是实践智慧图书馆的前提。智慧服务已经不再局限于图书馆自身业务数据的融合,而应该扩大数据获取的范围,多维度分析读者的行为,从而更加准确地感知读者需求,用以提升图书馆服务的“智慧”。图4是多维应用关联的理论框架体系,可从中窥见各类信息融合过程中需要采集的元素和获取方式。 3.1 资源监测体系 虽然部门、高校、行业等系统关注的侧重点不同,其需求不一,但是其数据的采集、挖掘与分析,以及呈现的关联理论与方法体系有一定的相似性。在此理论框架下,业务需求的关注点探测就可寻求资源监测体系的支持。各类型图书馆的多维应用关联实践,总体来说,围繞实际需求开展针对性较强的业务系统,往往降低了多维应用的关联性,系统越复杂,其多维关联的过程也越艰难。因此,业务资源的监测,是智慧服务环境下图书馆运营效率提升的基础,也是精准服务的前提。 3.2 空间监测体系 图书馆空间服务逐步被决策者与图情界所重视,创客空间等概念的提出,都是以图书馆空间再造为基础。读者对图书馆的利用不再是资源的利用,而逐步向空间与服务转变,空间的需求与服务方式的个性化,是吸引读者的有效手段之一。门禁、人脸识别、座位管理系统等都为空间监测提供了完善的数据监测节点,能够有效地对读者的空间行为进行大数据的分析,供图书馆空间服务的决策。空间监测体系的构建,是空间管理系统的多维关联应用。 3.3 服务监测体系 图书馆是一个服务型的部门,从资源服务,到空间服务,以及围绕读者的一切服务,直接的或者间接的都是图书馆所要规划的。图书馆的业务系统,都与服务相关。所以,智慧服务的前提除了馆员与读者以外,还应该包括业务系统的数据支持。馆员的服务需要感知读者需求,而感知需要是通过服务监测体系的构建实现的,也是业务系统数据层的多维关联应用。 3.4 安全保障体系 图书馆的业务环境,从数字图书馆建设开始,网络化的程度越来越高,这就对系统与系统之间,以及网络层、应用层等各个方面的安全提出了新的要求。节点的故障势必造成应用的故障,而核心数据的泄露必将造成读者隐私受到侵犯。所以,安全保障体系,不仅仅是图书馆系统的安全,也应该是各种数据的安全保护。 4 多维应用环境下智慧图书馆模型构建 4.1 多维表示 不同的业务系统对同一数据会使用不同的数据呈现形式,例如学工系统对用户的称呼使用“学生”,而图书馆系统中对用户则称呼为“读者”。多维表示可以将同一数据的多种表述解释出来。多维表示是信息环境下的普遍现象,存在于信息活动的各个环节和各个阶段,这在互联网环境下更加明显,最为典型的就是大众标签,同样的内容,不同的人标记的标签就不一样。多元表示包括两种形式: 一种是来自于不同认知行动者解读的在认知上不同的表示; 一种是来自于同一个认知行动者的在功能上不同的表示。从认知意义上来讲,即便是同一组认知行动者(如标引员) 在面对同一信息对象或情景时,其成员之间也可能会表现出认识上的不一致性或解释上的多样性[7]。在众筹众创时代,多维表示可以更好地揭示多源异构数据的多种形式,并且能够发掘出语义内容与关联的共同点[8]。 4.2 相关性原则 相关性(Relevance)是情报学尤其是信息检索研究中最基本的概念。近些年来,学者们围绕算法相关、主题相关、需求相关、情景相关与社会认知相关这5个不同的相关性类型进行研究[8]。关联数据、关联应用等都是基于一定的相关性原则,进行数据、应用的联系。多维应用也必须要遵循一定的相关性原则,才能够从数据层、应用层将业务真正地整合起来,以满足服务的需要。NoSQL等非线性关系数据库虽然能够解决异构数据库之间的相关性部分问题,但是应对超大规模并发的SNS类型的Web 2.0纯动态网站已显得力不从心。所以,相关性原则下的数据之间的融合,仍然是当前主要的实现方法。CAP原理能够解释在多维应用环境下的分布式系统不能同时满足一致性、可用性与分区容错性这三个需求,最多只能满足两个。对于高校图书馆而言,相关性类型主要指书目数据库、数字资源库以及各种业务数据库的相关性,涉及到算法、主题、需求、情景、社会认知等。智慧服务不仅涉及到技术部分的算法,更重要的是直接关系到读者需求、情景、社会认知、主题等人文情感方面。主观的信息检索研究相关性,已经不能够准确获取真实需求。数据层的应用关联,能够让读者降低检索工作量而准确地获取其所需的资源,这也是多维应用关联的设计初衷。 4.3 算法与模型 多维应用的数据融合的算法涉及较多,主要有概率论方法、人工智能相关算法、模糊推理方法等。概率论方法包括古典概型、几何概型、贝努里概型演变而来的贝叶斯方法,D-S证据理论等。人工智能相关方法,包括遗传算法、神经网络、深度学习算法等。模糊推理法包括模糊集、粗糙集等[9]。不同的业务其关联规则不同,例如事务中的处理变量,规则可以设定为布尔型与数值型;维度数据规则可以设定为单维与多维;抽象层次角度规则可以设定为单层与多层等。 统一数据源支持下的业务系统,业务之间的融合性较高,能够较为真实地反应各种业务运行的情况。多维应用环境,是采集渠道的多维性,其中包括空间系统、资源系统、服务系统甚至外部环境的数据资源。维度的选择是业务准确性、客观性与真实性的前提,也是智慧图书馆体现其“智慧”的重要方式。 5 多源应用环境下信息安全与隐私保护 5.1 云服务的安全保障 5.1.1 四维度防护策略 安全策略采用事前检测、事中防护和事后恢复的“全时空”策略,实现事前防御防范于未然,事后进行页面恢复。基于网页动态多机备份方案,能够保证图书馆网络平台的页面防篡改,正确的系统通过正确的备份页面返回给访问者,保障图书馆平台页面的正确性与安全性。 5.1.2集成防病毒网关应用 国内的网站攻击多为自动化攻击。大多数的Web防火墙是从IPS改变而来,其原理就是通过病毒特征值进行匹配。该方法虽然能够识别病毒,但是只是对文件头部的检查,而忽略了文件内容。集成防病毒网关的安全策略是对文件内容进行病毒扫描,同时对HTTP访问进行内容识别,这样才能最大限度避免病毒入侵对系统与数据造成侵害。 5.1.3 Webshell检测功能 “Web”服务是图书馆各种门户应用的常用服务形式,其需要服务器开放Web服务,例如图书馆的OPAC系统等。“Shell”的含义是服务器的操作权限。Webshell是匿名用户(入侵者)通过网站端口对网站服务器某种程度上操作的权限[10]。图书馆门户应用的安全策略,通过Webshell的检测、过滤、监控等手段,保障平台安全,阻断非法操作与攻击。 5.1.4 虚拟WAF与分级管理功能 网站管理过程中,需要通过单独的WAF 设备控制多个管理员,并分别配置管理相应的防护策略,在此策略下提供相对独立的攻击事件报警、分析日志与报表功能。图书馆以及机构网络平台引入该功能,以降低管理人员的工作量,提高平台管理效率。 5.1.5 关键字过滤、黑白名单功能 图书馆网络应用门户,是根据不同业务需求而建立的,内容也属于图书馆需要监测的范畴,内容篡改,非法字符等问题的防范,需要通过技术手段监测源IP地址,并加以自动管理,避免互联网门户在一定时间内被多次攻击的现象发生。 5.2 本地数据的安全保障 5.2.1 安全协议与认证功能 图书馆多源系统业务的支持需要使用计算与存储等服务,业务的关联首先需要各业务提供商相互的认证,服务系统之间也需要构建统一的安全认证协议。业务系统之间的关联应用,使得读者能够获取不同的、满足其真实需求的服务。在安全协议支持下,系统相互认证提高了业务的关联性[11]。 5.2.2 隐私保护与访问控制 以代理服务器的委托存储,例如高校数字化校园的一卡通管理系统,通过权限控制实现不同用户之间的访问管理。数据访问控制策略的保护,也是隐私保护的一种方法。多维应用关联系统环境下的访问控制隐私保护协议,可以采用秘密共享方案对数据进行分片存储,保障数据安全[12]。 5.2.3 数据完整性验证 数据的完整性直接影响到智慧图书馆业务实施的效果。下载完整数据,逐一验证对应的签名或者消息验证码,验证周期较长,不适于数据量较大的智慧图书馆实施。以群组用户身份隐私、动态广播加密与代理重签名相结合的数据完整性验证方案[13],在计算效率提升与降低存储冗余方面与传统方案相比有较大的优势。 多维应用关联的智慧图书馆构建,是以业务数据关联为基础的,其中涉及比较多的数据通信技术支持。各方面的系统有效关联与整合运行,才能够保障智慧圖书馆实施的高效性与稳定性。高校图书馆由于业务模块的多样化,运行了多元化的系统,而系统之间无缝对接的稳定性,相互配合的流畅性,是智慧图书馆实施智慧服务的关键。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。