“东北小延安”史志数据库建设的问题与对策
任英
【摘 要】史治数据库建设对于研究历史人物、历史事件,具有重要意义。提高建设史志数据库的意义与技术规范是通过建立一个“东北小延安”史志数据库来为相关研究提供有力的佐证。“东北小延安”的历史虽是人类历史小小片段,但对于研究中国现代史及中苏关系史具有重要价值。
【关键词】“东北小延安”;史志;数据库
【中图分类号】D64 【文献标识码】A 【文章编号】1001-0475(2017)09-0082-02
一、“东北小延安”的定义解析
说到“东北小延安”,很多人想当然地认为就是今天的黑龙江省佳木斯市,但作为一个历史概念,这个理解是错误的。
严格意义上讲“东北小延安:是指第二次国共内战时期,受共产党武装力量所控制的原合江省的大部分地区,即现在的黑龙江省铁力以东、穆棱以北的地区,东、北邻苏联,西界黑龙江省、嫩江省,南接松江省。
抗战胜利后,国民政府将东北分为九省二市,并派任首长与省府委员。苏联红军占领东北,在1945年11月共产党军队赶到佳木斯,成立了合江省政府。1945年11月7日,中共三江地区行政专员公署在佳木斯市成立,后成立合江省人民政府,下辖佳木斯市及依兰、通河、勃利、抚远、同江、富锦、桦川、汤原、鹤立、萝北、饶河、佛山、密山、宝清、鸡宁、虎林、东安17县。12月底设富锦专区,下辖富锦、绥滨、萝北、抚远、同江、佛山6县。1948年7月,牧丹江省撤销,所辖林口等县并入,合计1市19县。1948年年底辽西会战后,大部分地区为共产党所控。故而,国民政府所设立的合江省政府始终名存实亡。而这一时期的合江省因由来自延安的从中共最高领导岗位退下来的张闻天担任中共东北局所领导下的合江省的省委书记而被称为“东北小延安”。
由于“东北小延安”所处于的“进可攻、退可守”的特殊的地理位置,使得它在中国共产党武装夺取政权的斗争中起到了决定性的作用,故而,这段作为共和国前传的历史在张闻天得到正确的历史评价之后也逐渐为人们所重视,并展开大量的全面、细致、周密的科学研究。
二、“东北小延安”史志数据库建设的意义
任何科学研究都离不开事实与数据,而数据库就是相关事实与数据的集合。数据库从最传统的一张菜单或成绩或书目卡片单借助计算机与网络技术发展为大型的可实现智能检索的文献或事实数据库,成为现代科学研究的最强大而有力的工具。
历史研究同样要基于真实的历史人物与历史事件,但由于历史数据不同于自然科学的数据可以通过实验的方式进行验证,故历史的科学性、真实性与客观性更决定于历史的细节中。“东北小延安”的历史虽然只是人类历史中的沧海一粟,但这段历史的真实还原却是研究中国现代史的基础。
研究张闻天的生活与工作的轨迹,可以从一个侧面还原中共党史中若干悬而未决的问题,或发现一些史料上存在的纰漏与错误。从当时中共选择合江省作为夺取政权根据地这一决策实施的过程,可以发现当时共产国际成员间的合作与矛盾,从而找出直到今天仍然影响着中俄关系的历史渊源。特别是从业已解密的前苏联档案中可以找到中共若干历史决策的依据,去伪存真、厘清史实,为正确处理当前波诡云谲的国际局势提供史鉴。
因此,建立一个“东北小延安”史志数据库不仅可以为填补一段历史空白相关研究提供有力佐证,同时也可以借助大数据进行人工智能分析为历史学研究提供新的思路与方法,为人文科学的研究提供范例。
三、“东北小延安”史志数据库的数据类型
一个数据库是由若干个文档构成的,开发的“东北小延安”史志数据库将由以下几方面构成:
(一)图书类型文献
此类文献包括:
(1)正式图书型文献
这也分两类,一类是有标准书号的,其中包括1956年到1987年间使用的统一书号。它是由"人大法"大类号、出版社代号和此书在该社出版时的种次号三部分组成的;以及1987年1月1日以后使用的国际标准书号(International Standard Book Number,簡称ISBN)。另一类是1956年及以前的由正规出版机构出版的但没有标准书号的书型出版物,如1947年东北书店出版的《正义的呼声》和1948年东北书店出版的《土地改革》。
(2)非正式图书型出版物
这类文献主要是指非正式出版机构出版的书型文献。如1985年由佳木斯佳木斯党史委史会办公室编辑印刷的《党史资资料》。
(二)非图书型文献
此类文献包括:
(1)连续性非书文献
主要包括期刊,报纸。如1945年11月下旬,中共合江省委成立后,接收国民党佳木斯市党部的《佳木斯民报》,经改造改编后,正式创刊的佳木斯《人民日报》(后更名为《合江日报》)。中国共产党在东北解放区创办的第一张地区报纸《东北日报》(1945年11月1日~1954年8月31日)。合江工作通讯社在1945-1948年间编的连续出版物《合江工作通讯》等。
(2)非连续性非书文献
主要包括各种小册子、宣传单、书信及音像资料等。如1948年出版的由合江省鲁艺文工团农民组集体创作的话剧剧本《王家大院》,民国35年的《合江、松江地图》等。
四、“东北小延安”史志数据库的数据采集原则
“东北小延安”史志数据库数据采集的基本原则是:
(一)时效性原则。不同于一般的数据库,史志类数据的时效性,指相关文献与相关事件在时间上的紧密度,很显然,文献的出现距离事件发生的时间越近则越有价值。
(二)准确性原则。史志数据的准确性主要是指文献所描述的主体是由真实的人所发生的真实的事,任何虚构的人或虚构的事都必须排除。
(三)全面性原则。史志数据的全面性是其准确性的前提。任何历史事件如果仅选择性的描述部分的真实,实际上其结果可能比虚构更虚假。
(四)精确性原则。史志数据的精确性是指时间、地点、人物和事件的精确,是对历史的忠实与严谨,不能因政治立场而篡改史实或有选择性地描述部分的真实,更不能借“为圣者讳,为尊者讳”以掩盖历史的真相,或出于某种目的扭曲历史本来面目。
(五)直观性原则。史志数据同样要越直观越好,能用一个图表展示清晰的,不用繁冗的文字和数据。
五、“东北小延安”史料文献的抢救性修复技术
中国传统的古籍所用的纸张如麻纸、藤纸、椒纸、绵纸、宣纸等在制作的过程中加入了胡椒、花椒、石灰等碱性物质,既达到防虫防蠹的和防酸、脱酸作用。故有“纸寿千年”之说,而到了近现代,大工业化生产出的新闻纸,为降低成本,根本就没有在制作的过程中考虑到其长期保存的功能,因此,由这类纸张印刷的文献反而比存世几百年甚至上千的古籍出现的虫蛀、霉变、絮化、老化、酸化等现象更为严重,尤其是近现代新闻纸在造纸过程中为提高其光洁度和柔韧性而添加了许多明巩、动物胶、亚硫酸盐、氯气、硫酸氢钙等酸性物,以及保存过程中由微生物分泌带来的酸霉菌在生长和繁殖的过程中会分泌出多种有机酸的侵蚀,使酸化成为这类文献朽化的最重要的因素。
目前最有效的纸张脱酸技术方法有:
(一)液相脱酸法。这是一种使用碱性水溶液或碱性有机溶液来进行脱酸的方法,一般使用的脱酸剂如CaOH溶液、MgCO3溶液、Ba(OH)2-CH3OH溶液、(H3COMgOCOOCH3)溶液等进行脱酸处理。
(二) 气相脱酸法。这是一种使用能够气化或者挥发的碱性气体,如 NH3、C13H26N2O2、C4H9NO等对纸张文献进行脱酸处理的一种方法。
(三)物理方法。这类方法主要有超声波法、超临界流体萃取法等。
六、“东北小延安”史志数据库建设的技术规范
早期的文献由于时代的久远,通常是载体污损,字迹或图像模糊不清,对于采取印刷体的较为清晰的文本查采用OCR识别技术进行文字和图像的转换,并在转换后进行人工的辨识和校验,而对于非印刷体或清晰高不足的,则要完全进行人工录入,这是一项很艰巨的任务。
数据输入的格式应该采用规范的CNMARC格式,但要对部分著录项加以重新定义。
如010字段的各子字段原定义如下:
$a ISBN 不重复
$b 限定 不重复
$d 获得方式和/或定价 不重复
考虑到许多文献是使用统一书号的,$b项应改为TYSH(统一书号)
1~3字段可沿用原定义。
举例:
2001#a合江工作通讯@h13@f合江工作通讯社
由于这一时期的文献没有严格统一的出版规范。故4字段要重新予以定义:
410“丛书”改为“专题”,将同一主题的非书同载体文献合并于此,411“子丛书”改为“子专题”,录下位二级主题。其余不变。
6字段中的600子字段下加@b“别名”或“化名”。
举例:
《张闻天传》
600 @a张闻天@b洛甫@f1900-1976@x生平事迹
同样,606字段加@b“曾用地名”。
其它字段无须更改。
七、结语
由于数据库技术的日臻成熟,史志数据库建设的关键不在技术上,而在于信息的采集与处理的严谨性、周密性、客观性、翔实性与全面性上,由于这段历史已经过去了近七十年,亲历者日渐凋零,使得收集原始口述资料变得更加迫切,抢救即将消失的历史记忆,才是“东北小延安”史志数据库建设的重中之重。
参与文献:
[1]赵春艳,张鹏翔,姜殿清.“东北小延安”经济文献 考源[J]. 黑龙江史志,2015,(11).
[2]付昕,杨柏勤.网络环境下高校图书馆的信息资源 建设[J]. 佳木斯大学社会科学学报,2002,(4).
[3]赵峰.史志网站方志文獻数字化基本功能探讨—— 以13家史志网站方志文献数据库为例[J].中国地方 志,2016,(10).
[4]李丽芳,宋晶晶.民国图书出版发行信息的CNMARC
格式著录[J].国家图书馆学刊,2013,(5).
[5]刘圆圆,刘军华. CNMARC中有对应关系的字段解 析[J]. 图书馆建设,2006,(4).
[6 ]田育星,王秋喜.Ba(OH):脱酸原理及操作[[J].陕西 档案,2004,(3).
[7]郭君,秦杰.酸对档案纸张耐久性的影响及防治措 施[J].机电兵船档案,2004,(3).
[责任编辑:褚永慧]