我国古籍数字化水平已超过海外

标签: 公司动态

中文古籍是中国的,是古老的;数字化是世界的,是年轻的。在信息技术不断发展的今天,古籍与数字化的“联姻”,为我国古籍的保护、整理与传播带来了十分喜 人的形势。我国中文古籍数字化工程虽然起步比欧美国家晚,但是发展至今,目前无论在规模和水平上都已远远超过海外。这是记者从日前由首都师范大学电子文献 研究所主办的第一届中国古籍数字化国际学术研讨会上获得的信息。

    技术发展日新月异
    古籍数字化是指采用现代化技术,对古籍文献进行加工处理。具体而言就是借助计算机对古籍进行保护、整理、加工和传播,将古籍通过数字代码的形式存放。
    
    会 上,国内外专家普遍认为,古籍数字化是古籍整理和传播的未来方向,是大势所趋。数字化古籍以其信息量大、检索快捷方便、不受时空限制等特质,使古籍使用者 的效率大大提高。同时,古籍数字化也使许多难得一见的“镇馆之宝”得到新生,为广大读者阅览我国古代文献典籍提供了便利。
    
    来 自青海省文物考古研究所的张德芳说,这次会议让他大开眼界,有些技术真是“闻所未闻,见所未见”。比如,拥有一部《四库全书》不用再像过去一样要给它建7 座藏书阁,现在只需携带一个U盘就能带着《四库全书》走天下;更神奇的是,无论在何时何地,如果你有任何疑问,只要利用手机登陆专业网站,便可查询、下载 所需的典籍……
    
    哈佛大学也在使用我国内地产品
    据首都师范大学电子文 献研究所所长尹小林介绍,欧美、日本等国和我国港台地区早在上世纪80年代初期就启动了中文古籍数字化工作,中国内地相对较晚,大约在90年代中期才陆续 上马,但发展迅猛,大有后来居上之势,现在美国哈佛大学等一些国外知名高校都已开始使用由中国内地研发的数据库。
    
    目前,中国内地古籍数字化工作除古籍爱好者和研究者零星进行外,成规模的数字化工作基本上是由三种类型的机构来进行的:一是教学和研究机构,二是图书馆,另外还有商业机构。
    
    例如,国家图书馆已经制定了一个庞大的古籍特藏文献的数字化计划,具体项目包括碑砧菁华、西夏碎金、敦煌遗珍、数字地方志以及甲骨文、《永乐大典》等,其中有些项目已经完成,并通过网络为读者提供服务,有的还在进行中。
    
    北京书同文数字化技术有限公司于2000年研制完成了文渊阁《四库全书》,这是古籍数字化进程中具有里程碑意义的一件大事,为古籍的数字化制作树立了标本,积累了经验。2001年,该公司又制作完成了《四部丛刊》的全文检索版,收录了1万种古籍,可检索,也可看到原图。
    
    1998年成立的北京爱如生公司是很有实力的古籍数字化专业公司,它制作完成的数字化古籍总数在3万种以上。北京的国学公司推出的《国学宝典》,据悉其收录的内容比《四库全书》还要多出50%,该公司还从普及的角度推出了《国学备览》等价廉物美的电子产品。
    
    尹小林说,原来国外研发的一个《二十四史》的数据库售价是8万美元,属于非常高档的东西,但随着国内古籍数字化工作的发展,这些产品的价格在不断降低,为专家学者和国学爱好者带来了实惠。
    
    数字化后的新问题
    任 何事物在发展过程中总会遇到各种难题,同样,古籍数字化工作目前确实也存在不少问题。“如生僻字不能录入显示,检索程序的技术水平有待提高,符合理想标准 的电子古籍还不多见,大型网络古籍数据库需要安装专用的浏览软件,不少大型古籍需要制作成电子文本等等。”南开大学教授杨琳说。
    
    总结专家们的意见,记者感到目前问题比较集中的有以下几点。一是古籍数字化工作目前仍然缺乏一个统一的标准。比如,字形的问题。尹小林举例说,在古代典籍 中,一个字有很多种写法,比如在对联“氷冷酒,一点,两点,三点; 丁香花,百头,千头,万头”中,“氷”即“冰”,可只有一点,如果在数字化的过程中,将其改写成通用的“冰”字,就使原来的对联缺少了韵味,也很难理解。 再有,由于每家公司在制作时使用的格式和分辨率各不相同,在做数据交换的时候就遇到了困难,“这好比由于火车车厢、车轨宽度不同,很难实现火车对接。”尹 小林说。
    
    第二,目前一些古籍数字化工作还仅限于将古典文献直接扫描,做成电子出版物,这只适用于保存,既不利于学者检 索,也不利于广大青少年的阅读和传统文化的传播。“扫描是必要的,但扫描只是数字化的预处理,是古籍数字化工作中很小的一部分。要想让其利于传播和检索, 大量的工作还是前期的考证、标引并将其变成简体字进行新式排版等部分,这样才能方便普通读者阅读,并让其读到真正精准的古籍作品。”尹小林说。
    
    第三,由于缺乏全盘考虑和合理规划,许多古籍数字化工作存在重复建设的情况。一些经典著作被不同的公司和机构看好,被分别收录在不同的版本里,而一些不太被市场看好的典籍却往往受冷遇,至今还“养在深闺人未识”。
    
    第 四,古籍数字化的真实再现,是建立在正确理解原文基础上的文字转化,这对人才储备也提出了更高的要求。从业者必须是文理兼备的人才,既要掌握计算机技术, 又必须有深厚的国学功底。据悉,北京大学信息技术管理专业硕士点已开始尝试招收文科背景的学生,首师大电子文献研究所也计划招收古籍数字化方面的研究生。
    
    专 家们普遍认为,未来所有重要的古典文献都将数字化,并将变成社会公用资源,无偿使用。而同时,古籍数字化工作将永无止境,这是因为一方面每年都有新出土的 古代文献,另外今天的文献也可能就是未来的古籍。例如,目前业内人士将大部分精力放在1912年以前的古典文献上,而民国以来的文献由于保存不力,很多文 献的纸张已经酸化,其数字化的工作已经被摆上了议事日程。因此专家们建议,当下一定要抓住国家已启动全国古籍普查工作的契机,在普查调研结束后,应及时对 其进行分类整理,并按照其价值高低,有序地将所有入选国家古籍名录的典籍数字化。