[本篇论文由5var5VAR论文频道为您收集整理,5VAR论文频道http://paper.5var.com将为您整理更多优秀的免费论文,谢谢您的支持] [摘要]本文利用“中国知网”以及其他数据源对中国古籍数字化的有关研究进行调研,主要从“书目数据库建设”和“古籍数字化建设”两个方面,从理论探索和建设成果的角度进行梳理和总结,认为中国古籍数字化在理论和实践上都取得了不俗成绩,但在规划、标准、技术、合作等方面还存在一系列问题。
[关键词]古籍数字化;书目数据库;古籍资源开发[Abstract]This paper made a summary of the research of exploiting of Chinese ancient books by accessing theCNKI and other databases,reviewing the history of development of bibliographic database in China and the digitaltechnology applying to the associated areas,and pointing out the related problems such as planning,standards,tech-nologies and cooperation of digitization of Chinese ancient books.[Key words]Digitization of ancient books Bibliographic database Exploiting literature resources of ancient books自1992年李致忠先生在《略谈建立中国古籍书目数据库》一文中首次从宏观的视角提出要建立中国古籍书目数据库以来,以现代技术对古籍进行整理和开发的活动就一直方兴未艾,并在实践和理论研究领域都取得了不俗的成绩。其中,对古籍的开发主要围绕利用数字化技术、网络技术、计算机技术建立各种各样的古籍数据库,从而达到古籍整理、古籍保护、古籍综合利用的目的。本文围绕古籍的数字化和古籍数据库建设两个方面,对古籍开发的研究现状作一小结,以资业内参考。
1文献调研
针对上述两个论题,笔者利用“中国知网”进行了文献检索,使用“题名=古籍and(题名=数字化or题名=数据库)”、“题名=古籍and题名=数字化”、“题名=古籍and题名=数据库”、“题名=古籍and题名=数字图书馆”、“题名=古籍and题名=处理”、“题名=古籍and题名=本体”、“题名=古籍and题名=FRBR”、“题名=古籍and题名=元数据”对中国期刊全文库、硕士论文库和博士论文库分别进行了检索,检索结果如下。
1.1发文总篇数
检索式1的结果命中238篇文章,其中期刊全文库231篇,优秀硕士论文库6篇,博士论文库1篇;检索式2的结果命中151篇文章,其中期刊全文库145篇,优秀硕士论文库5篇,博士论文库1篇;检索式3的结果命中91篇文章,中期刊全文库90篇,优秀硕士论文库1篇,博士论文库0篇;检索式4的结果命中10篇文章,其中期刊全文库10篇,优秀硕士论文库0篇,博士论文库0篇;检索式5的结果命中22篇文章,经过过滤“非电子化处理、计算机处理”方面的文章得到11篇相关文献,其中期刊全文库9篇,优秀硕士论文库1篇,博士论文库1篇;检索式6的结果命中10篇文章,其中全文库7篇,优秀硕士论文库1篇,博士论文库2篇;检索式7的结果为0。检索式8的结果命中5篇其中那个期刊全文库4篇,优秀硕士论文库1篇,博士论文库0篇。
以上有4篇文章同时在题名出现了“古籍”、“数字化”、“数据库”等关键词,故有重复情况。通过去重处理,一共命中文献285篇。
1.2主题分布
通过对285篇文献进行内容分析,我们将其主题分布及发文数量胪列如下(表1)。
 2研究主题分析通过对检索到的文献的研究主题进行分析归纳,发现它们主要集中在以下几个方面:古籍书目数据库、古籍文献数据库(全文库)、古籍数字化理论、古籍数字化技术、古籍数字化资源库的建设现状与资源介绍,以及各专题古籍数据库的建设与数字化技术(比如民族文献、农业文献、中医文献等等)。下面选择几个主要的研究主题进行分析综述。
2.1古籍书目数据库建设的理论与实践中国古籍书目数据库建设发轫于20世纪80年代末,从自发的各自为政、各自摸索的行为,逐步向规范化、体系化、合作化发展,其发展大致可以分为探索引进阶段、积累成型阶段、全面启动阶段、联合编目阶段四个阶段,每个阶段都是在理论与实践的不断探索中取得进展。
(1)探索引进阶段。古籍书目数据库建设是我国最早开启古籍开发研究的领域。早在1988年,东北师大古籍研究所就开始了这方面的尝试。1991年,刘乾先对利用计算机整理及检索现存古籍书的经验进行了总结,对该项工作的起因、准备和具体的运作流程均作了介绍,描述了计算机处理和检索古籍数据的功能和优越性[1],这在当时的中国大陆地区是具有开创意义的。几乎与此同时,南京图书馆也开始了古籍书目数据库建设的尝试,他们最初的工作是将馆藏10多万张古籍书目卡片输入到计算机中去,建成“馆藏古籍书目(草目)数据库”,数据近20万条,包含馆藏古籍和影印、新印古籍[2]。但由于当时只是想取代手工目录,因此没有充分认识到书目记录规范性及采用机读格式建设古籍数据库的重要性。1992年,李致忠在《略谈建立中国古籍书目数据库》一文中,首次提出了建设中国古籍书目数据库的整体构想,对古籍书目数据库建设的基础性问题进行了分析,提出要制定统一的录入工作单[3]。该文的发表,对中国古籍书目库的建设指明了科学和规范化的方向。
由于当时在中国大陆建立古籍书目数据库尚属空白,很多技术和经验尚未积累,亟需借鉴其他国家和地区的先进经验,因此有些文献对国外古籍书目数据库建设的情况作了介绍[4-5]。1995年,李致忠先生结合几年来的思考又撰写了《再论建立中国古籍书目数据库》,对统一建库的认识更进一步,提出了“统一建库认识、统一建库规范、统一古籍机读格式、统一建库软件、统一字库”等意见[6]。
(2)积累成型阶段。早在1988年,中美两国图书馆就萌生了古籍合作编目的意愿。随着条件的成熟,1993年,北京大学图书馆设立了古籍合作编目工作站并实现了跨域通讯。1995年,工作站正式运行,其时共有北大图书馆、中科院图书馆、辽宁省图书馆、湖北省图书馆、复旦大学图书馆等单位加入,以工作单形式向RLG-CHRB提交中国大陆的古籍善本书目数据。
杨光辉在总结这一跨国合作项目的经验时指出,中国完全有能力建设自己的古籍书目数据库,并提出以这五大图书馆为核心,依托通讯网进行全国小范围的合作编目[7]。该项目的启动和运作,第一次在中国大陆范围内引入了古籍机读格式,并在古籍书目数据库的全面建设、规范制定、协调统一等方面积累了不可多得的经验。1996年9月,山东省图书馆经过多年的准备,正式启动了本馆古籍书目数据库的建设工作。王云堂对此作了全面介绍,指出了古籍书目数据库建设应具备的条件,并介绍了他们所做的前期准备、实施过程等[8],为古籍数据库的本地化建设提供了一个完整的案例。
与此同时,依托国家图书馆建设古籍书目数据库也引起了许多有识之士的关注。刘刚指出,应该把古籍数据库的建设跟当时国家图书馆的新书书目数据库以及普通图书的回溯数据库的建设连接起来,不能断层,并针对古籍书目描述中的分类和主题标引问题、机读格式问题,以及字库问题进行了探索,并首次提出以ISO10646字符集来解决古籍字库的问题[9]。针对古籍书目库的规范化建设,秦淑贞则从机读格式、分类、主题、字库等方面提出了自己的看法[10]。她认为,需要使用MARC格式进行统一处理,制定“古籍著录规则”,利用《中国图书馆分类法》、“中国古籍分类法”、《汉语主题词表》进行分类主题标引,并提出使用规范的简体字进行著录,这些都为我国古籍书目数据库的建设打下了理论基础。
(3)全面启动阶段。1998年至2003年,大型的图书馆自动化系统在全国范围内得到迅速推广。国内的ILAS、汇文,国外的INNOPAC、HORIZON、A-LEPH、SIRSI等系统在国内很多图书馆安家落户。这些系统以C/S为交互模式,以大型数据库为底层结构,以MARC为书目记录格式,适应于各类文献类型的建库。这些都为古籍书目数据库的尝试和规 [1] [2] [3] [4] [5] [6] 下一页
Tags:
|