数字化工具软件

数码翰林  

    专门针对大型文献资料和书籍进行数字化工程的强大工具,是建设数字图书馆的利器,是大型典籍、专题文献等电子出版物的编纂、出版平台。目前这一版本包括:数码大师、电子编目员和发布系统三个部分。

    这套工具软件在书同文公司参与开发的各项工程应用中经历了实战验证。无论从《四库全书》、《汉语大词典》、《中华文化通志》、《四部丛刊》、《人 民日报》、《科技日报》、《道藏》等古今文献数字化工程,还是各个数字图书馆工程均获得完满的成果。国内外多家图书馆和研究机构购买并应用该工具,实现了 数字图书馆和汉字语料库的建设。“数码翰林”开创了古今汉语数字化工具的先河,使大规模数字化工程成为现实。

       

数码大师:

    完成数字化工程前期对实体资源信息实施数字化加工。它通过对纸张载体或缩微载体进行扫描或数码相机拍摄而成的文字图形 信息实施切分、识别、转换生成编码文字,并通过软件来辅助和管理人工校对,用 XML 置以标识,使实体资源底层数据实现数字化,从页面影像信息转换成文字信息。
    它不仅适用于简繁文字的横排、竖排、印刷本或手抄稿,也适用于日文及英文数字的识别。它对已经成为电子形式的实体资源数据,也可实施半自动的 XML 标识。
    它具有在网络环境下,进行多工位的操作管理和科学的作业流程,它既可用于小批量的数字加工,又可用于大规模的数字化工程,能支持OCR数字化识 别、切分校对、聚类校对、图文校对,对工程实施有效的自动化监管,保证了数字化结果的高准确率。整套工具可以支持数百个工位的流水线作业。
   

 电子编目员:

     图书资料的编目自动化,是数字图书馆建设必不可少的环节。该工具可以很好地完成数字化识别、联机校对、编目信息的联机标引、 已有 MARC形式的机读目录 (无论是CNMARC/UNIMARC或USMARC)自动地转换为DC形式。 电子编目员的出现彻底改变了手工编目枯燥乏味,效率不高的状况,大大提高了数字图书馆建设的进程。

发布系统:

      将“数码大师”和“电子编目”生成的格式化电子数据,经过本系统配置后,既可以 Web 的方式在 Internet 或者 Intranet 上发布,用户通过 IE 浏览器 , 配合 内置的“书同文全文检索引擎”, 对数据进行浏览和检索,同时对数字图书和读者进行有效管理。

书同文巧笔  

    书同文“巧笔” Q-Pen 是一种基于 UNICODE CJK 汉字的手写输入法。它是非专业录入校对人员的好帮手,无需死记硬背常见的输入方法和编码,用鼠标即可轻松输入汉字。它最突出之点是涵盖汉字量大,包括简、 繁、异、中、日 32000 余汉字,为目前世界上处理汉字量最大的手写输入工具,是中、日古今典籍数字化的好帮手。

  

 全文检索引擎与汉字关联技术  

    这两项技术是在书同文公司所研发各项大型数字化工程中,已被广泛采用的独有技术。两者的结合,完美地解决了不同中文平台查询中经常遇到的问题,特别适用于大型古籍数字化产品的汉语字词关联检索(简繁、中日、异体、通假、正讹、古今、新旧关系)。

 联机字典  

    依据书同文自主开发的《康熙字典》电子版,适合灵活地挂接上各种古籍电子出版物,作为其中的辅助工具。

汉语辞书编撰平台  

     专门为汉语工具书的出版单位设计的辞书编辑平台系统。该平台按照“字不离词、词不离句、句不离文”的理念,依托书同文丰富的古今汉语语料库,使字、词、例证的搜寻与编辑实现联机自动化,为汉语辞书编辑工作者,提供了强有力工具。