阅读新闻

张涌泉教授重大项目“中华字库”工程第9包“手写纸本文献用字的搜集与整理”

[日期:2015-10-26] 来源: 作者:张磊

 

一、项目简介

手写纸本文献用字的搜集和整理是“中华字库”工程的一个子项目。手写纸本文献主要指吐鲁番文书、敦煌文献、黑水城文献、宋元以来的契约文书、明清档案等有别于宋元以后刻本的古代手抄的纸本文献。本项目选取七百多册十二万余件写本文献,书写时间跨度自魏晋以迄民国。这是近代汉字发展成熟的时期,在汉字发展史上处于承前启后的关键地位。与同时期的碑刻文献和后来的印刷文献相比,不但数量浩繁,而且字体不一,是异体俗字的渊薮。本项目将首次对魏晋以来手写纸本文献进行全面的搜集和数字化处理,并形成“魏晋以来手写纸本文献资源目录数据库”、“唐五代写本辞书文本”、“手写纸本文献电子图像库”、“手写纸本文献用字字形库及属性库”等成果。

二、项目承担单位及团队

浙江师范大学是浙江省属重点大学,中文一级学科博士点建设单位,其中汉语言文字学学科是浙江省高校重点学科(A类)。学校基础设施先进、功能齐全,图书馆现有纸质图书310余万册、电子图书205万余种。在校领导的大力支持下,专门为本项目的实施建立了手写纸本文献资料中心。

本项目负责人张涌泉教授多年从事敦煌写本文献、近代汉字研究,是敦煌学、语言学领域的一流专家。技术负责人陈年福教授主持并开发“甲骨文引得编纂及其数据库建设”,获得2010年国家社科基金项目资助。团队成员复旦大学张小艳博士是全国百篇优秀博士论文的获得者,长于敦煌语言文字研究。其他团队成员窦怀永、于淑健、张新朋、景盛轩、储小�、张磊等,在敦煌学、文字学或宋元契约文书研究等方面均有所建树。

三、技术方案

本项目研发方案主要包括以下几方面:

1.手写纸本文献资源选取。选取已经影印出版的手写纸本文献资源,并按专题加以收集、整理、编目。

2.制作手写纸本文献材料各专题图像数据库。将已选定的手写纸本文献材料,通过高分辨率扫描或高质量摄影做成电子图像,形成各专题数据库。

3.确定制定楷书字形选取标准。包括楷书字形选取标准、字形结构判定标准、笔画形态判定标准、字形楷定标准等。

4.制定字形属性标注项。包括字音、部首、笔画、例句、考释等项。

5.手写纸本文献未编码字形选取。在工程的统一平台上进行,将选取的单字及对应图像与其属性自动汇入工程有关数据库。

6.编制手写纸本文献用字字形总表。提供手写纸本文献的全部未编码字形及所对应的图形影像。

本项目通过大规模系统搜集我国古代手写纸本文献中的汉字,并进行数字化处理,在大力促进中华文明传承和普及的同时,将有效解决写本文献用字辨认难、数字化难、排版难等现实应用问题。

录入:系统管理员 | 阅读:496