我国少数民族历史悠久,许多少数民族在历史上创制了古民族文字,并以民族文字形成了极其丰富的反映各民族社会历史发展情况的文字历史档案。研究少数民族文字历史档案数字化建设的现状与对策问题,可更好地发掘、传播与利用这一优秀的民族历史文化遗产。
一、少数民族文字历史档案数字化建设的现状
少数民族文字历史档案是指建国前少数民族地方政权、土官、个人在其社会历史发展过程中以本民族文字直接形成的反映少数民族政治、历史、经济、军事、天文、历法、医药、教育、文艺、哲学、伦理、宗教和民俗等方面情况,具有保存价值的各种不同形式的历史记录。少数民族文字历史档案数量丰富、种类繁多,其中较为典型的是满文、藏文、维吾尔文、彝文、傣文、东巴文、白文、壮文、苗文、瑶文和水书等档案材料,按其现存方式可划分为古籍、文书、石刻(又包括碑刻、摩崖、石经墙、石经片和石经墩等类型)、金文、印章、竹简、木刻、贝叶、骨文、皮书、布书、瓦书和陶文等。现今,少数民族文字历史档案的数字化建设处于起步阶段,现状如下:
1 .少数民族文字数字化技术多为高校、民族研究所、计算机中心等机构进行开发。以藏文数字化技术的研究为例。1986年由青海师范大学研究开发的TCDOS2.0版藏文系统通过了鉴定,这是第一个收入使用的藏文系统;中国藏学研究中心和航天部701所于1988年8月推出了藏文文字处理及激光编辑排版印刷系统,后与潍坊华光合作开发出了华光书林藏文排版和激光照排系统;中国计算机软件与技术服务总公司、民族印刷厂、北京大学计算机研究所、中国民族语文翻译中心联合研制并推出了北大方正藏文书版系统,北大方正1997年推出了基于WIN31的藏文维思彩色印刷系统;西南民院计算机研究室开发了基于DOS平台的SPDOS汉藏文版操作系统和藏文文字平台。
2 .北方地区少数民族文字数字化技术的研究领先于南方地区。除藏文外,其他少数民族文字数字化技术开发情况如下:
(1)蒙古文。内蒙古计算中心开发出蒙文、汉文、英文操作系统,与山东潍坊合作研发出华光V型蒙文书刊、图表、报纸激光照版系统;内蒙古大学研制出MPS蒙汉混合字处理系统;内蒙古大学与北大合作开发出《北大方正电子出版系统》蒙文版。内蒙古社会科学院蒙文研究所的苏·苏雅拉图研制出基于Windows95的蒙古文处理系统(便携式计算机)。
(2)维、哈、柯文。主要有1989年新疆民语委主持开发的博格达维、哈、柯、汉、英、俄多文种排版系统;北大方正及潍坊华光已都研制有维、哈、柯文的排版系统;1997年6月新疆开发的《未来多文种系统VTDOS6.1》。
(3)朝鲜文。如方正朝鲜文书版系统和思维系统;华光推出的书林朝鲜文系统。
(4)锡伯文、满文。有新疆民语委主持开发的计算机锡伯文、满文文字处理和轻印刷系统;内蒙古大学等研制的满文系统;辽宁省档案馆和东北大学计算机语言工程研究室共同开发的满文操作系统。
(5)彝文。有北大方正和西南民院合作开发的彝文系统书版软件;西南民院自行开发的VCDOS汉彝文双语平台和SPDOS汉彝文版汉字操作系统,后又推出了Win95彝文文字平台;由云南省民语委和云大计算中心合作开发的云南规范彝文排版系统。
(6)傣文。北大方正开发的傣文电子出版系统;潍坊华光开发的傣文电子排版系统。
(7)壮文。由北大方正研制的在英文基础上稍加改造后实现的壮文书版系统。
(8)苗文。云南省楚雄州光亚电子研究所研制的苗文排版系统。
3 .档案系统少数民族文字历史档案的数字化管理工作尚未全面开展。现今少数民族地区许多档案馆(室)都收集珍藏有满文、藏文、维吾尔文、彝文、傣文、东巴文、白文、壮文、苗文、瑶文和水书等少数民族文字历史档案,这些档案大多处于手工管理阶段,只有少数档案部门开展了少数民族文字历史档案信息的数字化工作,档案系统尚未开发出单一或多民族的数字化管理系统软件;在现有档案管理软件中,也没能开发出少数民族文字历史档案的管理功能,这就极大地限制了少数民族文字历史档案的利用效率与范围。
二、少数民族文字历史档案数字化建设的方法
(一)引进与采用少数民族文字数字化的技术与科研成果
如许多高校、民族研究所、计算机中心等机构在少数民族文字处理技术方面开发出了藏文、蒙文、维文、朝鲜文、锡伯文、满文、彝文、傣文、壮文、苗文等。在数据库建立方面,蒙古文和藏文取得了显著的成绩。1987年完成中世纪蒙古语文数据库;1993年在完成100万词缀(现代蒙古语文数据库)的基础上,又完成了《500万词级现代蒙古语文数据库》;完成了《元朝秘史》拉丁标注、汉文标注和汉文旁注本的检索统计系统,在《现代蒙古语词频统计》的基础上又整理出《现代蒙古语频率词典》;研制了MHJ—1型蒙古语言分析软件包;1990年推出蒙古文拉丁化输入方法,开发了从新蒙古文到老蒙古文的转写软件,完成了蒙古文词根、词干和附加成分的自动切分与复合词的自动识别系统;蒙文字幕机系统,蒙汉混排图章计算机辅助设计系统,篆文刻绘系统,蒙语文节目微机管理系统,微机蒙文图书目录管理系统,蒙医癫痫病专家系统等。
此外,广西壮族自治区语委主持开发了壮语词库;西南民族学院开发出彝文(四川凉山规范彝文)字幕机系统;中国社会科学院民族研究所完成了1994年基金项目——中国少数民族语言文字多媒体数据库。这些少数民族文字数据库的建立,为少数民族文字历史档案的数字化提供便利条件。
(二)积极开展少数民族文字历史档案的数字化工作
1 .键盘输入。键盘输入是少数民族文字历史档案数字化的一种基本形式,目前已经开发出许多少数民族文字输入法,各民族地区的档案馆(室)工作人员可根据所管理少数民族文字历史档案的情况选择具体的少数民族文字输入法,以作为少数民族文字历史档案数字化的基本工具。
2 .扫描仪。扫描仪的工作原理是把纸上的图形、图像或文字信息变成像素点阵,再用二进制数表示这些点阵,从而将图形、文字变成数字,输入计算机。由于扫描仪可以将整页的少数民族文字、图形或图像直接输入计算机,因而在少数民族文字历史档案信息的输入方面具有广阔的应用前景。
3 .数码相机及摄像头。数码相机摄制的图像可以通过标准串/并行口输入到计算机,内部的PC卡可以直接插入计算机使用,拍摄到的图像可以用计算机进行处理,保持图像的原样而不失真,图像质量很高。数码相机及摄像头可用于少数民族文字历史档案的拍摄、复制、存储和传输利用。
通过以上各种现代化技术,即可将各种类型、各种形式、各种载体的少数民族文字历史档案信息输入计算机,建立完善的数字化少数民族文字历史档案信息系统。
(三)开发少数民族历史档案数字化管理系统
少数民族历史档案数字化管理系统是一类可扩展的知识网络系统,可采集、加工、处理、存储、组织、发布和利用少数民族文字历史档案信息资源,管理软件的开发应遵循以下原则:
1 .标准化建设
(1)编码字符集标准、键盘标准、字模标准。如内蒙古自治区计算中心完成蒙文字符集、键盘、字模国家标准;新疆语委主持完成维、哈、柯文的字符集、键盘、字模国家标准;在国家语委和国家技术监督局及电子部的直接指导下,西藏自治区藏语文指导委员会办公室主持,西藏大学、西北民族学院、青海师范大学共同完成了藏文编码字符集、键盘、字模的国家标准,这一标准正式由国际10646(即ISO\10646)大字符集讨论通过,成为我国第一个进入10646国际字符集标准基本平面的少数民族文字字符集;四川省民族委办公室主持完成了彝文字符集、键盘、字模的国家标准;锡伯文信息处理信息交换用七位和八位编码图形字符集国家标准正在编制中。此外,国际标准1%文字符集的蒙文字符集、彝文字符集、维、哈、柯文字符集的补充集和锡伯文字符集正在制定中。
(2)术语标准化。正在制定的国家标准有蒙古语术语标准化的一般原则与方法,藏语术语标准化的一般原则与方法,维吾尔语术语标准化的一般原则与方法,朝鲜语术语标准化的一般原则与方法等,均为北方少数民族的术语标准化原则与方法。此外,还有蒙、藏、维、哈、柯、朝等语种的辞书编纂一般原则与方法国家标准正在计划制定和修订中。
(3)档案标准化。在软件的设计与选用上,首先要看是否是在档案管理标准指导下开发出的软件。开发少数民族历史档案管理软件可参照采用的档案标准有《档案著录规则》、《文献保密等级代码》、《国家机关公文格式》、《档案分类标引规则》、《计算机软件开发规范》等。
2 .动态性原则
(1)采用新型数据库管理系统。由于Windows系统的广泛流行,Foxpro关系型数据库正逐渐取代老的数据系统,它可以高度兼容Dbase和Foxbase,具有操作更简捷,调整修改方便,界面美观等特点而成为软件开发者的强有力的工具之一。
(2)注意留有二次开发接口。在档案管理自动化方面有一些项目有待完善与改进,如文献主题词的标引,不同文体之间的相互转换,文献全文关键词检索,以及自动组卷排列等。因此,少数民族历史档案管理软件设计要先构建总体结构,留有补充功能接口,在不断升级的过程中完善和增加各种功能。
3 . 注重系统的扩展性
在设计和选购软件时,要考虑有相应功能的驱动软件,如多媒体操作系统,多媒体窗口系统和多媒体数据库管理系统,可增加扫描仪、光盘驱动器、可擦写光盘机以及声卡、视卡等硬件,并可组成一台完整的多媒体少数民族历史档案管理系统。
(四)做好数字化少数民族文字历史档案的利用工作
1 .少数民族文字历史档案信息的检索。目前,许多计算机信息管理软件都有制作多种档案检索工具和多数据库文献查询检索的功能。各个档案机构在开发少数民族历史档案管理系统时,应能够进行多数据库多线索的少数民族文字历史档案模糊查询,可以按照文字类别、文献标题、文献主题词、文献载体材料、文献所属类别、民族类别、形成时间等项目进行多途径检索,并且可以将检索出的结果由用户自己设计打印出来。
2 .少数民族文字历史档案信息的输出利用。在少数民族文字历史档案信息的输出利用方面,计算机网络具有强大的传输功能。在计算机网络建设方面,根据国内外经验,考虑到我国通信技术和通信线路设备的现状,利用微型机灵活性强、价格较低、建网快、易于普及等条件,首先在各主要民族地区建立微机局域网络系统,实现一定范围内的少数民族文字历史档案信息资源共享。待条件成熟时,再在局域网络的基础上建成全国性的大型网络,便于社会各界对少数民族文字历史文献的查询、研究和利用。