公司业务产品

1.书同文古籍库

由于书同文长 期在古籍数字化行业的实践,精确了解客户在使用古籍全文检索数据库上的习惯,依此开发了数据库内容为一系列使用率高版本精良的典籍文献精品,服务模式基于 云服务,无特殊客户端下载无特别安装的亲和性服务。数据库拥有强大的检索系统、完整的功能平台和灵活的纠错机制,可通过多条路径、采用多种方法进行快速海 量检索,可轻松实现古籍浏览、校勘、标注、分类、编辑、下载、打印的全电子化作业。

目前书同文古籍库内容含有《四部丛刊》全文检索库,《四部备要》全文检索库,《中国历代石刻史料汇编》全文检索库,《十通》全文检索库,《大明会典》全文检索库,《光绪新法令》全文检索库。

2.明清档案文献网

《清代档案文献数据库》是中国第一历史档案馆重点清史档案文献数字化工作项目,由书同文公司承接,是国家清史编纂工作的基础工作之一。它是目前国内外首次运用先进的中文数字化技术进行大规模历史档案文献数字化的成功案例。

书同文所研发的该数据库利用馆藏一千余万件珍贵清代档案文献和该馆数十年已有档案文献整理成果,依托最新信息技术 和古籍数字化技术,有计划、分步骤地加以 实施,最终将建成最具规模的清代档案文献专业数据库。该项目是档案文献工作者和古籍数字化科技工作者的共创成果,其问世标志着清代档案史料的刊行进入了信 息化的新阶段。

目前包括全文数字化《大清历朝实录》和《大清五朝会典》与《军机处上谕档》。

3.书同文汉字网

书同文汉字网是书同文公司创始人张轴材先生潜心近二十年在汉字编码方面的研究,接合现代网络技术,为 广大读者学者呈现的多区域汉字在编码以及书写方面的权威性分析比较,项目属于国家教育部十一五重要项目,研究成果纳入商务印书馆《中国语言生活绿皮书》系 列出版中,其中包括汉字差异性比较,汉语教学,汉字研究,辅助在线小工具,对于汉字规范性学习,对外汉语教学,数字化出版领域均有一定的帮助,同时也是中 文信息技术开发的基础项目,本产品的目标,就是要方便师生们浏览和查阅这些汉字编码书写异同,希望起到辅助的作用。据统计,这些资料不仅对学习中国大陆的 规范汉字有益;反过来,对中国大陆的人士学习其他国家/地区的汉字文化也有帮助。

如有需求请试用:http://hanzi.unihan.com.cn

4.档案历史账目整理,数字化加工服务

经历了中国第一历史档案馆《清代档案文献数据库》档案整理、全文数字化工作,故宫博物院《陈设档》档 案帐务整理及全文数字化,同时在十几年间接受了《道藏》《台湾地方志》《大藏经》等数十亿典籍全文数字化工作。可为各大图书馆、档案馆进行历史文献档案的 全文数字化加工服务,亦可进行前期的原档整理工作。

书同文拥有自主版权的以OCR为核心的在线无纸校对系统,特别对于古籍的全文数字化有合理分配人力,校对错误率逐步收敛降至最低的核心功能,并提供无纸校对的云服务。

5.数字化工具软件 - 数码翰林

书同文公司推出的大型数字化软件工具——《数码翰林》,是对实体资源信息和元数据实施数字化加工、结构化置标、提交发布,并在网络环境下向公共提供信息服务的集成性软件工具。目前这一版本包括:数码大师、电子编目员和发布系统三个部分。

它基于国际上最新的技术标准和规范,以处理古今文字资料为特点,是建设数字图书馆的利器;是大型典籍、专题文献等 电子出版物的编纂、出版平台;是国家机关、企事业单位和科研、商贸团体在网络环境下向世界展现自己、建立数字化网站的便捷工具;它是书同文公司从《四库全 书》、《汉语大词典》、《中华文化通志》、《四部丛刊》、《人民日报》、《科技日报》、《道藏》等古今文献数字化工程直至两岸五地(香港、澳门、中国台 湾、中国大陆、日本)"孙中山数字图书馆"示范工程实践经验的积累与升华的成果。

《数码翰林》嵌入的OCR引擎不仅能识别印刷体,而且能识别手写体;不仅能识别简化文字,而且能识别古籍文字(繁体字、异体字、讹字、俗字);不仅能识别中文,而且能识别英文和日文。

《数码翰林》嵌入的全文检索引擎加入了汉字的简-繁-异体关联、中文-日文的汉字关联、图文关联、书目与内容的关联;在未来的版本里,还将加入在《四库全书》和《四部丛刊》电子版中业已实现的语音关联、词义关联、内容和知识工具的关联等功能。

全套《数码翰林》所采用的Unicode是SD/SB(Single Data/Single Binary,一套数据/一套软件用于多文种的视窗平台)的基础,使得公司的产品和用户的数字化信息,能无障碍地走向世界,使之成为全球化的产品,实现最大范围的资源共享。

《数码翰林》开创了中国古代汉语数字化的先河,使古籍的数字化成为了现实。《数码翰林》是适用于众多领域的一体化的应用信息软件系统。

6.汉字属性信息分析

按照客户要求进行国际通用大字符集 ISO/IEC 10646 中日韩统一编码汉字的形、音等属性信息的分析和统计。除此之外,我们还可进行基于丰富古今词库资源的古籍文史资料或现代图书资料的词目频度、使用覆盖率的统计分析。