标题 | 国际开放获取学位论文资源的整合利用研究 |
范文 | 李秋实++宋仁君++张雅男++柴雅凌++刘红玉![]() ![]() ![]() 摘要 通过网络调研,了解主要的国际学位论文联合OA仓储及国外36所大学含学位论文的机构知识库的建设情况、知识产权使用条款,根据其建设现状,分析了国际学位论文的OA仓储在用户利用方面存在的问题,并结合OA仓储的知识产权授权及政策,提出构建OA国际学位论文一站式获取平台的解决方案。 关键词 学位论文 开放获取 知识产权 OA仓储 机构知识库 1 引言 学位论文是具有独创性的研究成果和不可或缺的学术资源,越来越受到科研、教育和学术界的重视。20世纪中后期,世界上每年产生的硕博士论文约10多万篇。但是,由于作者通过毕业论文答辩后绝大多数学位论文不公开发表或出版,仅由作者所在单位收藏,一直属于难以获取的灰色信息资源类型。笔者调研了天津高校的用户信息需求后发现,师生对国外高校的学术论文获取有着强烈的需求。 随着开放获取运动的不断发展,作为一种重要的文献类型和高等教育的内生资源,学位论文成为国际开放获取的主要目标之一,很多国外高校通过机构知识库公开发布了本校的学位论文,国际上也陆续出现了一些学位论文OA联合仓储。 开放存取资源仓储名录(Directory of Open Ac-cess Repositories,OpenDOAR)是由英国诺丁汉大学和瑞典隆德大学图书馆于2005年2月共同创建的开放获取仓储检索系统,可以提供全球高品质开放获取信息资源库清单。据2015年4月5日统计,OpenDOAR中收集的开放获取网站中有1565个含有学位论文的内容,仅次于含学术论文内容的1965个。在含学位论文的OA仓储中,由于学位论文的特别属性,高校主导的OA仓储占有绝对优势,为1450个,占93%;其中,含学位论文的联合类的OA仓储有45个。 越来越多的学位论文可以免费获取,这是一个有待深入开发利用的宝藏。国际学位论文OA仓储的建设情况,用户利用这些OA仓储资源面临的困难和问题,在开放获取和知识产权双重框架下能否及如何整合这些资源等,自然会成为我们高度关注的问题。 2 国际学位论文联合OA仓储的建设现状与知识产权政策 OpenDOAR收集的含学位论文的联合OA仓储有45个,其中有5个仓储经多次测试已无法链接。这些仓储中的文献以英语语种为主,此外还涉及法语、德语、芬兰语、日语、波兰语、西班牙语、葡萄牙语、丹麦语、瑞典语、挪威语、印地语、阿拉伯语、波斯语、乌尔都语、加泰罗尼亚语、北印度语、古吉拉特语、加泰罗尼亚语等20余种语言。 其中,最主要的大型国际性学位论文OA仓储有美国的开放存取学位论文数据库(Open AccessTheses and Disertations,OATD)和学位论文网络数字图书馆(Networked Digital Library of Thesesand Dissertations,NDLTD),国家和地区性的比较成功的学位论文联合OA仓储有澳大利亚国家图书馆特罗韦数据库(TROVE)、英国电子学位论文在线服务(Electronic Theses Online Service,EThOS)及台湾博硕士论文知识加值系统(National Digital Li-brary of Theses and Dissertations in Taiwan,NLT-DT)和港澳地区博硕士论文跨校集成系统(Disser-tations and Theses Collections, HKLIS DTC)等。 2.1 主要的国际性学位论文OA联合仓储:NDLTD、OATD等 NDLTD是由美国国家自然科学基金支持的一个网上学位论文共建共享项目,始建于1996年,其目标是创建一个包括NDLTD成员单位和其他组织提供的博硕士学位论文的全球联合目录,以此提供一个查找电子版博硕士论文的统一入口。NDLTD可按题名、作者、文摘、主题、机构、发布年、语种等途径检索,可免费获得论文的题录和详细摘要,有部分论文可以得到PDF格式或SGML格式的全文。目前美国、加拿大、南非、香港、台湾、印尼、意大利、巴西、苏格兰、秘鲁、德国等全球200多家大学图书馆、7个图书馆联盟、29个专业研究所加入了NDLTD。它目前已收录学位论文389万多篇,其中英文为982114篇,但经测试可免费获取的全文仅几万篇。 在知识产权方面,NDLTD的文献元数据信息是由参与建设成员自行提交的,并明确其收录学位论文需要得到作者的授权,授权采用作者自愿的原则。因此NDLTD提供的论文全文授权是混合型的,部分是可以免费无限制获取的,有的是有限制下载的,有的则是需要付费的,也有大量不提供原文下载。 OATD仓储采集了全球1000多所院校、大学和研究机构的学位论文元数据信息,目前共有254.5万条记录。OATD由一个OATD指导委员会来经营这个网站,指导委员会成员来自美国图书馆与信息技术协会及一些大学图书馆。该OA仓储致力于提供所有支持开放获取的学位论文的索引网址,所有全文只有链接到原始机构库才能获取。OATD对学位论文的前30页进行索引,但并不对论文的全文进行索引和存储。OATD的元数据来源为大学自建的OA仓储、一些区域或国家ETD联盟建立的OA仓储,还有一些由OCLC的WorldCat提供。除少数例外,元数据大多依据开放文献元数据收割协议(OAI-PMH)从这些网站收割而来。 在知识产权方面,由于OATD仅收割提供标准收割接口的OA仓储学位论文的元数据,不直接提供论文原文(提供到原网站的链接),这就有效规避了可能遇到的各种知识产权问题,可以认为提供标准收割接口的OA仓储已经默认同意外部收割,并为此提供了技术方便。 欧洲学位论文联盟数据库(DART-Europe)为NDLTD的欧洲成员,是研究型图书馆和图书馆联盟为促进欧洲研究生学位论文的国际开放获取而建立,由欧洲研究图书馆学会支持,伦敦大学执行管理职能。该库由欧洲28个国家,569所大学参与建设,收录OA学位论文56万余篇,其中收录论文较多的国家为:德国20余万篇,荷兰、法国、英国均分别超出5万篇。该数据库由各大学负责提交论文,提交情况很不平衡。 知识产权方面,DART-Europe没有对用户进行任何限制规定。有些论文可以直接获取全文,可获取论文中有些标明延迟开放、需等待,并明确给出延迟开放获取的时间。 2.2 主要的国家和地区性学位论文OA联合仓储 TROVE前身为始于1998年的澳大利亚国家数字论文的合作计划(Australian Digital TheseProgram,ADT),该数据库目前收录澳大利亚国内40多所高校和部分新西兰大学的的博硕士论文31.8万篇,全部文摘可免费浏览,根据论文作者授权的不同,还可以免费阅读学位论文的前两章或全文,其中可开放获取的学位论文全文有7.4万篇。联合库里的学位论文都是各大学提交的,由于提交不及时,联合库内的论文与各校自建的OA仓储比较而言滞后很多。TROVE在使用条款中明确规定,仅可用于非商业性使用。 EThOS始建于2007年,最初的EThOS是英国联合信息系统委员会(Joint Information SystemsCommittee,JISC)数字存储项目的一部分,它的设计开发与资助都来源于JISC项目。EThOS目前集成了英国121个高校机构的电子格式的学位论文,有38万多篇博士学位论文,最早可回溯到1600年,约有16万篇通过链接到机构知识库可获取全文,该库数据至少每周更新一次。有90多个机构知识库的论文通过OAI-PMH协议每月被收割进入EThOS,也有参建机构采用直接提交方式。 在知识产权方面,EThOS的使用条款几乎是最为严格的。它规定检索和浏览的时候不需要注册登录,但直接从该数据库下载全文需要注册登录。这样做的原因是“为了保护论文作者的权利,将剽窃的机会降到最低,通过用户注册和登录可以跟踪论文被谁、在哪里下载。只有同意其提出的使用条款和条件,才能访问一篇论文。”该库还设置了不允许替他人下载论文的规定,甚至明确表示不允许图书馆员代读者下载论文。同时,该库为用户提供收费论文服务及收费邮寄论文等“增值”服务。 NLTDT是台湾“教育部”委托“国家图书馆”建立的学位论文共建共享平台,截止2015年4月3日,该系统共收集了已获全文授权的博硕士论文884482篇,326835篇全文提供开放获取。包括国立交通大学、国立中正大学、国立台湾科技大学、国立“清华大学”、中国文化大学等台湾地区共71所大学。2010年10月25日,其正式成为国际NDLTD组织的机构会员。检索结果有的标明支持开放获取,有的不支持。有的论文虽然标为OA,但有明确的开放日期,在此日期前是不能获取的。对于可以开放获取的,还需要进行会员注册登录。 HKLIS DTC是香港和澳门8所大学的图书馆目录和机构知识库里的博硕士学位论文的在线联合系统,提供8所大学的学位论文信息并有部分全文可OA下载。这8所大学是:香港中文大学、香港城市大学、香港浸会大学、香港理工大学、香港科技大学、岭南大学、香港大学及澳门大学。其中,只有香港科技大学、香港大学和岭南大学提供全文下载,共4.6万篇左右。 知识产权方面,HKLIS DTC没有对用户做其他规定。 3 国外大学机构知识库使用条款 OpenDOAR收集的含学位论文的大学OA仓储有1451个。被OpenDOAR收集需要申请和审核,因此,实际的含学位论文的大学OA仓储远不只这些。美国2014年排名前200的大学绝大部分都有OA学位论文,但各校OA学位论文的数量相差很大,多则4-5万多篇,少则仅几百篇(参见表1)。 在知识产权方面,多数大学的机构知识库以促进开放的学术交流为目的,在CC-BY协议框架或更严格的CC-BY-NC-ND协议框架下开放使用,没有明确提出对其学位论文元数据收割、再利用的授权或限制性条款。一些大学构建本校机构知识库的主要目的是学术成果的存档,因此这些大学自建的包含本校学位论文内容在内的机构知识库并不依循CC协议提供开放获取。也有一些大学对使用者提出了严格的限制性使用条款。部分大学以获取学位论文全文需要在其网站注册、登录的要求,表明他们希望对学位论文全文的下载和使用保留控制权。 在大学自建的机构知识库中,学位论文资源通常是不可或缺的重要组成部分,但在研究中没有见到各大学对其学位论文的利用有专门的条款,因此我们只能以机构知识库整体的使用条款作为研究对象。事实上,由于学位论文大多不是正式出版物,很少涉及到出版商利益,相对正式发表的学术论文,其开放获取的阻力和障碍更小些,开放获取的尺度也更大些。 本研究仅选取36所大学(学校名称见表2)的自建机构知识库进行了研究。 调研发现一些大学(9家)的机构知识库没有特别的数据再利用授权或使用限制条款,但所有机构知识库均对成果提交者提出了其必须满足的知识产权的要求。可见大学在建设机构知识库时,更为重视的是确保自建的机构知识库不会触犯他人的知识产权。这很大程度上是由于大学建设学术OA仓储的主要目的是促进开放的学术交流,因此,在不侵害版权者利益的前提下只需使用者遵循最基本的CC-BY协议,即在CC框架下尊重作者的署名权即可。 具体研究大学机构知识库针对使用授权及对上传成果应具备条件的相关规定,我们发现条款主要涉及如下相关内容:遵从CC、署名权、非商业目的、禁止演绎、格式迁移等。相关统计汇总参见表2。 遵从CC-BY署名权应该是所有机构知识库建库和对使用者的共性要求,因此,一些机构知识库网站没再提到这一点,但也有一些网站对此进行了特别的强调。如堪萨斯大学的机构知识库明确遵从“知识共享署名一非商业性使用3.0许可”;不列颠哥伦比亚大学机构知识库明确遵从“知识共享署名一相同方式共享4.0国际许可”。 有14家机构知识库明确申明禁止用于商业目的(NC)。如卡尔霍恩海军研究院的版权提示重申了美国版权法,明确图书馆和档案馆授权提供的“复印件或者复制品不能用于除个人学习,学术或研究以外的任何目的”。内布拉斯加大学提示“在CC许可下发布的材料可以在非商业用途下被重新使用,重新发布等,只要署名权属于原作者和刊物”。杜克大学的提示是明确简短的“不能把资源用于商业性的目的”。可见,尽管是同样的禁止商业性使用,不同的表述对使用者的限制程度也是不同的。 有9家机构知识库明确申明禁止演绎(ND)。如新墨西哥大学在版权项下提示“可以打印、复制和使用信息,并检索包含出版物或图像在内的文件,新墨西哥大学的网站文件只允许用于非商业、个人或教育目的,只要(1)不修改这些信息(2)包括任何最初包含此类信息和此通知所有副本的版权声明。”美国马里兰大学在要求提交者签署的授权文件中提到“通过签署并提交此协议,我无条件地授予马里兰大学非独占权许可……以无偿向不改变材料内容的用户提供复制、公开展示和分发资料服务。” 有6所大学的机构知识库明确提到了成果提交者授予机构库建设者或使用者以格式迁移的权利。 黄永文等学者认为:“开放获取主要有两个层面的含义:一是指人可以免费地阅读和再利用;二是指机器可以下载和对内容进行挖掘。”我们所调查的36个机构知识库中没有一家对机器下载和进行内容挖掘给出明确的授权或禁止。这个结果也与黄永文等学者的一项统计相符,他们统计了Open-DOAR中注册的2194个开放仓储对元数据和全文再利用的规定,结果表明明确禁止元数据再利用的仅有0.1%,明确禁止全文再利用的仅有0.3%;允许商业目的再利用元数据的有5.1%,允许商业目的再利用全文的为零;但在另一方面,没有一家明确提出禁止机器自动收割所有元数据,而且没有提供元数据和全文再利用说明的均达84%以上。 4 0A学位论文仓储建设存在的问题与解决方案 通过对国际学位论文联合OA仓储和各大学自建含学位论文的机构知识库建设现状的网络调研,笔者发现,当前已建学位论文OA仓储主要存在如下几方面不利于科研人员利用的问题: 第一,各大学自建的机构知识库各自独立,形成一个个新的信息孤岛,不便查找;且学位论文多仅为机构知识库的一部分,进入到不熟悉的大学机构知识库中快速找到学位论文的入口并非易事; 第二,国际学位论文联合OA仓储尽管在解决信息孤岛问题上有所进步,但普遍存在不同程度的收录数据范围的局限,特别是地域性的局限; 第三,国际学位论文联合OA仓储大多是由各大学自行维护和提交的,很多大学的维护和提交非常不及时,以至于联合仓储中的数据量和大学自建机构库的数据量有很大的差距,时滞问题突出; 第四,现有国际学位论文联合OA仓储均将大量不提供全文与提供全文的数据混建,能够提供全文的学位论文所占比例很低,并且其提供的全文链接信息并不准确,经常有无法链接、下载后仅为论文目录、摘要或仅含有前若干页文献的情况,所有这些均影响了希望找到全文的研究者的用户体验。 为解决上述问题,我们期望构建一个更强大的国际学位论文联合OA仓储,整合各大学和区域性国际学位论文仓储,建立OA国际学位论文一站式获取平台;该仓储仅收录可以获取全文的OA学位论文;为避免现有联合仓储的时滞问题,仓储元数据直接取自各大学的自建知识库,并及时更新。 针对上述目标,我们进行的技术性研究与测试表明,实现上述期望并不存在实质性的技术障碍,最大的困扰还是知识产权问题。在前述对国际学位论文OA仓储知识产权问题研究的基础上,因应学位论文知识产权问题相对比较单纯(大部分没有商业出版)、大部分OA仓储没有明确禁止机器自动收割元数据的实际情况,在秉承以促进开放的学术交流为目的、遵循CC-BY-NC-ND协议的原则基础上,我们提出如下构建开放获取的“国际OA学位论文数据库”分步整合实施方案: 第一,整合提供OAI-PMH标准收割接口的OA学位论文。首先收割提供OAI-PMH标准收割接口的OA仓储学位论文的元数据,对论文全文链接的有效性进行测试性访问,仅保留可以下载全文的元数据。但在数据库中并不直接提供论文原文,而是提供到论文全文原网站的链接。 第二,整合获得元数据收割授权的OA学位论文。直接同OA仓储建设机构联系,争取获得对其学位论文元数据收割的授权,在取得授权后,按前一实施方案实施整合。 第三,整合没有对元数据收割提出异议的OA仓储学位论文。直接同OA仓储建设机构联系,告知其拟进行的收割行为。对在一定期限内没有收到异议性意见的OA仓储元数据进行收割,并按前一实施方案实施整合。 第四,定期跟踪扫描源数据仓储,实现与数据源更新基本保持同步。 第五,直接同OA仓储建设机构联系,争取获得对其学位论文全文备份的授权,以便在原网站链接出现问题时,能够为访问用户提供补充链接服务或文献传递服务。 开放存取运动的出现、机构知识库建设的兴起,为解决国际学位论文的获取难题打开了一个窗口。由此出发,为用户铺设一条平坦快捷的抵达国际学位论文获取之路才是我们的最终目标。达成目标并同时比较完美地兼顾知识产权无疑是一项十分艰巨的使命,仅凭单馆的力量几乎是不可能完成的任务,这需要借助图书馆联盟的力量才能实现。这其实也正是我们图书馆人的职责所在,是体现图书馆联盟的价值所在。 |
随便看 |
|
科学优质学术资源、百科知识分享平台,免费提供知识科普、生活经验分享、中外学术论文、各类范文、学术文献、教学资料、学术期刊、会议、报纸、杂志、工具书等各类资源检索、在线阅读和软件app下载服务。