
“全息字典”:古今汉字一键查
一项具有权威性和便捷性的汉字查询系统现已正式上线,这就是语委重大基础资源建设项目所打造的“汉字全息资源应用系统”。不再需要奔波于古籍阅览室,也不再需要翻阅厚重的字典,只需轻点鼠标,即可查找到相关汉字的现代字形、字音、字义信息,以及其在甲骨文、金文、篆书、楷书等历史阶段的字形演变。
此系统集现代中文信息处理技术之大成,构建了一个关联、科学系统、高效实用的汉字全息数据库。无论是初学者还是研究汉字的专家,都能从中获得相应的帮助。项目主持人、北京师范大学教授王立军详细介绍了系统的多层级字集设计模式,包括常用字集、现代通用字集、古籍印刷通用字集和全字符集等,以满足不同用户的需求。
对于古文字爱好者和研究者张华来说,该系统犹如一场。他不再需要翻阅多部字典来查找汉字的形、音、义演变,只需借助资源库,便可轻松实现“古今汉字任你查”。
该系统的上线,为汉字家族带来了一张全面的家谱。涵盖的字符集包括常用字集3500字、通用规范字8105字、古籍印刷字16490字和全字符集81722字等;同时包含辞书20种、古籍文献60种和历代字形图415675个。这些丰富的信息资源分别来自古文字拓片、文字编、规范字表、编码字符集、历代辞书等,涵盖了古今各个时期文字的五大重要信息。
数据库的构建离不开对汉字属性的分解、层次的确立和中介的寻求。王宁教授解释道,团队从上世纪90年始总结汉字的属性,除形、音、义之外,还增加码和用两个部分。这样,将笼统的汉字个体资源库转化为汉字属性库,解决了关联的多角度问题。系统还通过《说文解字》等核心家族成员来联系汉字家族内部的不同族群,实现了谱系的绘制。
该资源库还具有沟通古今的重要特征,让通用规范汉字与古文字、繁体字相互关联。系统的主体字集是8105个规范汉字及其关联字形,通过与传承字、繁体字和隶定字的关联,进而与小篆等古文字关联,实现了古今汉字的有效贯通。
为了保证对收录的每个汉字形、音、义解释的权威性,系统选取历代具有代表性的辞书作为基础素材,建构数据之间的深度关联。在字义方面,常用义项来源于《通用规范汉字字典》,并给出历代辞书的释义内容。系统还通过多种属性的综合呈现来加深人们对每个汉字的理解。
除了权威性,该系统的检索方式也十分便捷。系统提供单字、拼音、部首、部件、笔画等多种检索方式,使用者可以根据自己的喜好和需求选择适合的方式。除单字检索外,还满足综合检索、专书检索和历代字形检索。
