“互联网+”时代数字档案信息资源建设的众包策略探究
摘 要:文章探究“互联网+网络大众”的档案众包及实施策略,以介绍国外档案众包实践为基础,分析众包可在收集、加工(整理、鉴定、检索、编研)、利用上开展应用,并以构建众包平台、控制众包内容质量、激励用户参与众包、保障众包用户权益为思路论述数字档案信息资源建设众包的实施路径。
关键词:互联网+;数字档案信息资源;众包
目前,国内档案领域对众包的研究主要是介绍国外档案馆如何利用众包促进数字档案信息资源建设的实践案例,极少有人探究如何利用众包来建设我国数字档案信息资源。因而,本文从网络信息消费大众数量将更多、大众参与创新将更盛的“互联网+”时代背景下,提出以众包为实施路径,即“互联网+网络大众”的方法,探究我国档案馆实施众包的策略。
1 国外档案众包实践
2013年,美国行政会议(行政立法机关)宣布美国国家档案馆的“公民档案工作者倡议”获得2012年度沃尔特·盖尔霍恩(Walter Gellhorn,美国知名法律专家,公民权利和法律的现代研究先驱之一)创新奖,以表彰“公民档案工作者倡议”通过众包项目在转变机构与公众之间的关系中取得的成绩。[1]美国国家档案与文件管理署实施的公民档案工作者(Citizen Archivist)项目有11项活动提供公众参与:标签、转录、制作字幕视频、上传和分享、转录旧天气、编辑维基文章、进入比赛、提出建议、志愿者等。这些活动可直接在网页上检索到,或通过国家网站如Archives.gov、Challenge.gov及受公众青睐的社交站点如Flickr、Tumblr找到。对每一活动的操作和公众所做意义,都有相应的文字介绍,部分有视频。登录进入tag活动,其分主题提供图片,选择感兴趣的主题,对图片做关键词、贴标签、详细描述等,每个主题下所要做的任务不是相同的,有的是关键词、有的是贴标签等,都会详细说明。除美国外,英国、荷兰等国家也有档案众包项目,具体如表1所示。档案众包是指档案馆以互联网为基础,将自身所承担的信息资源建设以及相关服务的工作,以自由自愿的形式外包给非特定的广大的网络大众的做法。[2]
2 众包的基本认知
2.1 众包。众包(crowdsourcing)一词于2006年6月由杰夫·豪(Jeff·Howe)在美国《连线》(wired)杂志上首次提出。众包是指一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定(而且通常是大型的)的大众网络的做法。其中,众包的重要的先决条件是开放的形式和大规模潜在的劳动力网络。[3]由此可见,众包具有基于互联网、开放共建、网络大众协同创作等基本特征。
2.2 众包与外包的关系。对于组织机构而言,众包与外包的相同点在于都是将任务“包出去”,委托给组织机构以外的人员完成。不同点在于:第一,对象不同。众包的对象是网络环境下的大众用户,是一对多的关系;外包的对象是某一专业机构或组织,是一对一的关系。第二,协作关系不同。众包由任务吸引大众自由自愿参与,具有“自愿协作”大规模交互关系;外包是雇佣人员提供服务,具有劳资双方关系,具有“雇佣”双向合作关系。第三,经济报酬不同。众包分为有偿和无偿两种方式:有偿方式为发包方需付费购买接包方提供的成果,无偿方式为接包方为网络上的业余爱好者、志愿者等,其成果可供无偿使用,其多为追求精神满足和自我价值的实现;外包仅有有偿方式且要价较高,需要支付高昂的费用。
3 “互联网+”时代众包在数字档案信息资源建设中的应用
3.1 众包在数字档案信息资源收集中的应用。
3.1.1 思维上创作成果的收集。网络大众在众包平台上开发档案众包项目,在创作过程中,由于著作者思维的活跃,有的著作者会增补相关内容,完善成果。如此,众多新型的有价值的成果毫无疑问地丰富或活化了数字档案信息资源,从而有利于数字档案信息资源的收集,而这种侧重于思维意义上创作成果的收集,相较于一般意义上的实体收集则更高层次化。
3.1.2 实体上征集成果的收集。以收集更多相关方面的实体数字档案信息资源为目的的档案众包项目,则更多侧重于实体收集。这些实实在在的成果可共享给众包平台上的网络大众,也可由档案馆收集整理,丰富馆藏。在美国国家档案与文件管理署(NARA)的“Citizen Archivist”项目中,就允许用户上传相关方面的数字图像、上传并分享档案。
3.2 众包在数字档案信息资源加工中的应用。
3.2.1 整理。集中体现在对数字档案信息资源的序化与诠释等。网络大众对其进行转录、翻译、编辑,譬如使经扫描后一些特定年代和特殊背景下的数字档案信息资源,能够以现行的语言或翻译件表达出来,让人们看得懂,能体会其中的含义。如澳大利亚爱荷华大学的“DIY History”项目,网络大众在转录过程中遇见的陌生词语、缩写等,都要以现行的语言表示出来,无法翻译的时候也要以相关的猜测([小镇?])或以(?)的形式表示出来。
3.2.2 检索。集中体现在对数字档案信息资源的著录及提取关键词等。档案馆对某一件档案提取的关键词,有时并非符合大众检索习惯,以致部分档案检索查找较为困难,检索后并不能快速找到目标档案,轻者浪费查找时间及影响利用者心情,重者使这部分档案无法发挥功用,“埋没”档案自身价值。因此,由大众对部分数字档案信息资源自行归纳提取关键词,参与著录过程,使检索词能更加贴近大众检索需求,部分意义上可提高检索词的精准度。
3.2.3 鉴定。集中体现在对数字档案信息资源的考证辨伪等。对于有着历史神秘感以及在真实性、完整性等方面存在问题的可公開数字档案信息,可交给庞大的网络大众进行推敲验证,这种对脑力活动要求较高的鉴定项目,极大可能地激发网络大众对“档案”的好奇心理和研究心性,从而提高档案尤其是档案内容的真实可靠性。
3.2.4 编研。集中体现在编前研究的建言献策等。编前研究是编研的重中之重,网络大众可对编研的主题给出意见,为查找相关于主题的档案资料提供线索,也可在主题所涉及的政策、研究热点等方面给予提示。
3.3 众包在数字档案信息资源利用中的应用。
3.3.1 参考咨询。对于一般的网络大众而言,发出档案基本知识、档案法规、档案查找利用方法等方面的咨询的可能性较大;对于有着档案教育背景的网络大众,更多会发出档案研究课题、档案学科发展等方面的咨询;对于从事档案服务的商业性专业机构,可能会发出档案外包、数字档案馆建设等咨询;对于存储档案的档案馆,发出的多为档案业务外包招标、档案信息服务大众满意度调查等咨询。因此可设置分众的参考咨询栏目,针对这些咨询都可由网络大众有选择性地回答,清楚明了的解说与答疑,使有着各种档案需求的大众及机构获得相应信息。
3.3.2 休闲档案。根据自己的兴趣做事本身就是一种休闲,网络大众根据自己的兴趣参加档案众包项目,在这个开放的众包项目中,无论是在参与开发建设,还是在随意浏览,都展现着网络大众休闲的情绪。开展档案众包活动,不仅融入了休闲档案的理念,也促进了档案开放共享的动力。
4 “互联网+”时代众包在数字档案信息资源建设中实施的路径
4.1 构建数字档案信息资源众包平台。众包这一模式得以实施的关键就是网络平台的搭建和潜在参与者的网络连接。[4]
4.1.1 “自给自足”式构建平台。“自给自足”式构建平台,是指以现已存在的档案信息官方网站为基础,只是从中嵌入和开发进行档案众包的相关网页,便于直接发布和管理众包项目的平台构建方式。其中,档案馆可选择与相关企业、科研院所、高等学校进行技术合作,合力开发众包平台或自行开发。譬如,荷兰阿姆斯特丹档案馆的“保存肖像”“众人参与”项目,都与Picturae公司合作進行。
4.1.2 “顶层设计”式构建平台。“顶层设计”式构建平台,即国家级档案馆或省级档案馆牵头构建档案众包总平台的方式。该平台是共用的,其他档案馆可借助此平台将档案众包项目发布,不需其自行构建开发,如此省去大量的开发众包平台所需的资源消耗,使人、物、财资源相对薄弱的市县级档案馆也有可发布众包项目的平台。同时,也鼓励将众包平台构建方式开源给其他档案馆,便于自愿自行构建众包平台的档案馆利用。
4.2 控制数字档案信息资源众包内容质量。
4.2.1 源头——参与者的控制。美国麻省理工大学进行的一个名为the Edgerton Digital Collections的项目,旨在为一名在学校中极受欢迎的教授(Harold Edgerton)转录和数字化其笔记。为吸引人员参与项目,发包方在麻省理工大学的校友杂志上发布广告,以此来提高参与者知识水平较高的可能性。从宣传的角度把控参与者的质量,以此增加获得高质量档案众包成果的可能性。所以发包方在鼓励网络大众参与档案众包项目的同时,也可以适当地有所倾斜,在知识水平或专业性集群较高的平台上宣传众包项目,以期获得更好的参与主体。
4.2.2 中流——制作过程的助力。为了确保最终完成的众包内容质量,除了重视参与者这一主要因素外,也不可忽视众包平台在创作过程中发挥的助力作用这一次要因素。大众在项目开发平台中创作时,众包平台应提供尽可能的帮助,如提供链接到国家公共图书馆、各个数字档案馆、维基百科等网页;提供可能用到的工具书、软件等;允许参与者提问到该众包平台内外的社区。这种微小而不可或缺的助力作用,在解决大众开发过程中的问题,使其在困惑不解时能柳暗花明、提高众包内容质量等方面起着重要作用,所以档案众包平台应从各个方面为众包项目开发建设提供可助之力。
4.2.3 收尾——制作成果的审核。第一,强调“人”在审核中的作用。对于转录等基本操作性业务而言,可通过“多方参与—彼此比对—第三方定夺”的形式减少由于粗心造成的差错;对于添标签、注释等工作,可采取“公众、专家双评审”机制;如遇到多方争执、难以定夺的问题,便可交给专家团来商议解决。[5]强调公众参与成果审核的同时,还需要强调该成果的完成者,应该认真审核自己的“作品”,注意语句是否通顺、注释是否标注、转录是否一致等。此外,也应在每个项目中适当地限制人数或适时地控制时间,否则无限制地提交成果,不利于成果的收集及审核。因此规定每个项目中每个小任务的参与人数,如转录该图片仅限20人,该项目的截止时间为××是极为必要的。如在限定的人数和时间内最终成果没有达到发包方的要求,则另外加人或延时。第二,强调“智能系统”的审核作用。对于不限制时间和人数而允许庞大网络大众参与的项目,可采取智能的审核系统,其对海量数据进行初步过滤,以避免出现打广告、政治倾向有较大偏颇或完全脱离问题等答案,该“智能系统”若能做到语义、答案相似度的集群归类审核则更佳,保证成果的可读性、可用性。
4.2.4 升华——专家小组的整合。对于参与者众多、成果丰硕的重大的档案众包项目,却缺乏对成果的系统梳理和整合,岂不是巨大的浪费?可将最终形成的丰富的成果进行专家级的审核校验和整合编纂,具体做法为在平台上形成专家小组,小组成员可为实名认证的国内外档案领域或其他领域的专家、教授等以及众包平台上具有资深经验的网络大众。针对不同的众包项目,对不同的人发出邀请形成专家小组,未被邀请的人也可申请加入。这样利于数字档案信息资源的深度加工,再一次升华成果,进而得到更精细的作品。
4.3 激励用户参与众包项目。举例来说,兴趣、享受和社会交往都可认为是参与者加入众包的内在动机。[6]经济报酬或其他利益可认为是参与者加入众包的外在动机。
4.3.1 经济报酬或奖励式的有偿激励方式。抓住参与者的外在动机,设置两种有偿激励方式。一种是实在的经济报酬,以货币激励;另一种是用“奖励”替代报酬,比如可赠送相关的档案编研成果、相应的积分、允许访问不向外界公开的档案等。目前,在荷兰阿姆斯特丹档案馆的众人参与项目中,根据网络大众在项目中贡献的多少给予相应的积分奖励,其可利用这些积分兑换自己中意的与档案相关的复制品。
4.3.2 志愿者式的无偿激励方式。把握参与者的内在动机,设置无偿激励方式。无偿激励方式也可看做志愿者模式,其重点在于抓住众包参与用户的内心情感或自我实现价值的需求,让参与众包的网络大众,从内心深处感受到被需要、被重视及被信任,从而积极地、持续地投身到档案众包项目中,最后获得自我价值实现的幸福感,这也正符合马斯洛需求层次理论中的第五阶层——自我实现需求。外国学者Brabham认为,相较于外在动机如金钱、报酬,大众参与者的内在动机包括学习、乐趣、自我肯定等更能影响参与者的行为。[7]
4.4 保障众包用户权益安全。
4.4.1 众包平台的保駕护航。一是对于金额悬赏或是赋予权益的奖励,发包方要及时提供给参与者,赢得公众信任。二是保证众包用户申诉渠道的畅通与及时受理申诉,实实在在为参与者服务。
4.4.2 众包用户提高维权意识。如果没有用户的积极响应和使用,众包平台制定实施的权益保障策略也难以得到践行和提升。用户权益在受到威胁与损害时,要有强烈的维权意识,不能只有“认栽”“下次再也不来”等消极心态,应增强维权意识,为自己的权益安全尽心尽力。
参考文献:
[1]美国家档案馆的“公民档案工作者倡议”荣获2012年度政府最佳创新实践奖[J].陕西档案,2013(2):17.
[2]赵宇.档案众包平台的构建及运行机制研究[J].浙江档案,2016(4):23~25.
[3]Howe J. The Rise of Crowdsouring[J].Wired,2006,14(6):176~183.
[4]邵平.“互联网+”催生服务众包新业态[J].服务外包,2015(5):78~80.
[5]谈伟.国外“档案众包”实践及引发的思考[J].四川档案,2014(2):51~52+57.
[6]夏恩君,赵轩维,李森.国外众包研究现状和趋势[J].技术经济,2015(1):28~36.
[7]BRABHAM D C.The myth of amateur crowds,information[J].Communication&Society,2012,15(3):394~410.
(作者单位:上海大学图书情报档案系 来稿日期:2016-11-30)