分享到: | 更多 |
为了中华文化走向世界
——转业军人尹小林破解古籍数字化“瓶颈”记事
新华网北京11月24日电(记者 张选杰 李宣良)中华古籍浩如烟海,数字化时代如何让这些承载中华文化的古籍更好地走近普通大众、走向世界舞台?
转业军人尹小林历经10多年研发成功古籍“自动标点、自动比对、自动排印”三大核心技术,取得中华古籍数字化整理与传播的历史性突破,破解了国学文化走向世界的数字化“瓶颈”。
“三大核心技术”攻克古籍数字化“瓶颈”
2002年,精通古代汉语与计算机软件的尹小林从第二炮兵转业后,创立北京国学时代文化传播股份有限公司,启动国学文献数字化工程。
尝试、失败,再尝试、再失败……经过无数次挫折,尹小林终于研发成功“自动标点、自动比对、自动排印”三大核心技术,不仅改变了古籍整理、研究的传统模式,更重要的是为古籍数字化打开了一个新的大格局。
“自动为古籍加注标点,是古籍整理工作者多年的梦想。”中国社会科学院语言所研究员杨成凯说,自动标点技术基于对大规模带标点文本的分析统计,以句型为基础,辅以语法分析和字词切分技术,对无标点的古籍文献自动加上合适的标点符号,使大规模古籍数据整理成为可能。
校比异文,同样是古籍整理最基础也是最繁琐的工作,不仅耗费大量人力,而且很难杜绝谬误。自动比对技术能自动进行多种版本古籍的逐字比对,显示出文字和符号差异。其利用计算机能对海量文本进行快速查找、匹配,可以显著提升比对的效率。
自动排印技术可将大型古籍数据库迅速转换为书版文件,解决了古籍生僻字造字、简繁体转换、横竖版式、自动生成索引等多项技术难点,可实现排版、出片、打样、印刷“一条龙”,极大地提高出版效率。
《四库全书》是中国历史上规模最大的文化宝库,总字数达10亿,用传统方式对其进行标点整理,需500人连续工作100年才能完成。“如果运用‘三大核心技术’,同样的人力,5至8年即可完成这项宏伟的数字化整理工程。”尹小林自信地说。
跨越从传统到现代的“历史天堑”
“古籍是中国的,是古老的;数字化是世界的,是年轻的。”尹小林说,“我所做的古籍数字化是在跨越一条从传统到现代、从实体书到虚拟网络的‘历史天堑’。”