出土古文献语料库建设研究年.doc
1国家社科基金重大项目工作简报课题名称出土古文献语料库建设研究批准号10其二,本书所收字形尽量反映字形视觉之美的丰富多样性,这可为书法创作、欣赏和研究创建一个真实历史字样资源库其三,本书收字努力反映不同断代和种类器物所附着文字的风格特征,这对于历史、考古研究的某些门类和环节,特别是文物鉴定研究将提供重要的参照物资料。关于该书的创新,可以通过与既有同类型书籍的比较来说明。呈现汉宁历史形态的书籍,该书并非始作俑者,传统的“字汇”“文宁编”亦是此类书籍。但若以陈寅惜先生“作一部文化史”的要求来看,既有的“字汇”“文字编”往往存在着种种缺陷一是字形不真。即此类书籍所呈现之字形大多出于今人摹写,书法水准高低姑且不论,丢失诸多原始信息是确定无疑的了;其次是不能贯通。即其所呈现的汉字资料,只是汉字发展史长河巾的某一横断流域,有的是专类字编,如甲骨文编金文编,有的是断代字编,如战国文字编秦汉魏晋篆隶文字编;再次是信息不全。只给字形,不附其所出文例,乃是传统“字汇”“文字编”的通例。而文字语境的缺失,每每会模糊文字本体的而貌。显而易见,传统“字汇”“文字编”的上述种种不足,正是本书编纂中所着意突破的重点。从这个意义上说,作为一部系统收录历代各类文物上所见文字的原始形态并着意揭示其种种发展演变轨迹的实物文字资料整理类专书,该书具有突破或曰首创的意义。4,古文字考释提要总览(五册)该编纂选题,基于语料库的“电子诂林”的目标设定而成立。语料库在完成巨量古文字考释研究论著的整理、提要并与原始文献字词单位全面邦定的基础上,该编纂成果也就水到渠成了。由于语料库的建设实际开始于本课题立项以前,所以该编纂选题也是在课题立项前已经起步,因此被列入上海市“十一五”重点出版项目。当然,这不应该影响该编纂选题作为本项目阶段成果的性质。该书的补阙创新性,一方面表现为在“集成”性上超越既有同类成果,收录截止于2012年的古文字考释意见55000余条,数量上是古文字诂林的两倍,全书出齐后当是迄今收录材料最多的古文字集释类工具书。另一方面,又表现为呈现形式的细致周到,对接现代社会网络阅读方式,构建了一种传统文本与网络检索资料互补的复合型阅读载体,即在编者所在单位教育部人文社会科学重点研究基地华东师范大学中国文字研究与应用中心网站“文字网”(HTTP//WWWWENZICN)上,为该书的纸质图书专设检索窗口,读者在阅读纸质图书时,可以查询各种相关补充和修订资料。仅以55000余条考释论著提要中一个样条为例简说如下10其中第一列为“字头”,第二列为“古文字原形及其文献出处”,第三列为“隶古定”,第四列为“字形类型”,第五列为“考释提要”,第六列为“考释论著的出处”,第七列为“‘文字网’关联号”。而其中前六列中的文字,既是该书纸质本必须的信息,又是与该书网络检索资源的一个关联路径“字头”列,其中文字标明考释者认定的古文字字形的字头归属。通过网上的字头检索,可以检索所有认定为该字的考释意见和涉及的具体文字材料。“古文字原形及其文献出处”列,标明作为考释论著具体考释对象的古文字原形,如果考释论著明确所考字形所出的具体文献,则在所列原形后注明具体文献出处。如“样条”第2列中的“”即为第5列的论著提要所考释的对象,而其后的“鄂君启节”,即表明“”出自战国青铜器“鄂君启节”铭文。古文字原形及其文献出处的设置,除了可以起到明确“考释提要”的涉及对象的作用外,还将形成全书相应的网络检索路径,即通过它们可以将全书涉及相同原形字或相同文献出处的各家考释意见类聚到一起。“隶古定”列,列出与字头结构有差异的原形字的隶古定字形。如“样条”第3列中的“”,结构与第2列中的“”一致,而与第1列中的“上”有明显差异。“隶古定”的设立主要为了形成另一种网上检索路径,即可以将全书涉及相同结构古文字的各家考释意见类聚到一起。“字形类型”,标明考释论著所考字形的类型归属。“样条”第4列中的“金文”,即标明第2列中的“”属于金文。若考释论著所考字形跨类,则此栏空缺。“字形类型”的设置,可以形成专类古文字考释的检索路径。“考释提要”列,给出考释论著具体考释意见的要点。“样条”第5列中的内容,即于省吾先生对“鄂君启节”铭文“”的考释意见提要。作为全书的主体,“考释提要”力求客观、简明地反映考释者的意见,着重反映考释结论,以及关键性的考释论证或论证材料。考释提要具有全文检索功能,在此基础上可以形成一些高级检索,如检索程序通过通假术语,可以把所有考释中认定的通假字筛选出来,等等。“考释论著的出处”列,依次标明考释者姓名、论著名、论著所出期刊、出版社及出版时间。“样条”第6列中的内容即表示第5列中的文字是出自考古1963年第8期所载于省吾的论文鄂君启节考释。“考释论著的出处”中的各个要素,都将成为全书的一种检索路径,当然通过它们之间,以及与其他各个字段的相互组合,又可以相应的高级检索。第七列,即“‘文字网’(HTTP//WWWWENZICN/)关联号”,则是一个专设的与网络资源关联的唯一编号列,通过关联编号在“文字网”上进行检索查询,可以获得更多相关信息1,考释论著全文;2,字形所出的原始文献材料全貌;3,补充信息,即由于新的材料发现和研究进展所形成对本条考释的补充和修正材料。以上古文字考释提要总览内容的检索路径,在“文字网”上的对应检索窗口见以下载图11传统文本与网络检索资料互补的关联书系阅读载体,其优越性是显而易见的。首先是它可以突破传统文本检索的局限,提供更为便捷的网络数字检索手段。上述各列形成的多路径检索,可模糊可精确,其功能之强大,自然是文本检字不可比拟的,轻点鼠标的瞬间,即可化解文本翻检的种种麻烦。其次是突破传统文本的篇幅限制,以网络资源为纸质图书补充大量的背景资料。而这将大大提升纸质图书的功用和影响力,又可以实现纸质图书篇幅的有效控制。另外,网络关联的呈现形式还有很多好处,比如,能够发挥网络的随时更新功能,及时补充、修正书籍内容,这就突破了光盘电子书的限制,形成了图书不受时间限制的自我完善机制。二、出版资金短缺情况上述编纂成果因为均与语料库建设具有很直接的表里关系,因此随着语料库的建设的按计划推进,目前的编纂情况均属顺利。但是在出版过程中遇到不小的困难,主要原因,在于资金。如前所述,这些编纂成果因其穷尽、集成特性,都具有很大的体量,虽然已经获得了一些来自政府的出版资助,但相对出版所需资金量而言,缺口尚大。因此,这些成果要通过出版正式面世,都存在不同程度的困难。中国出土简帛文献引得综录,按申报规划计15种每种篇幅为大16开10001200页,字数在100万字以上,全书总计大约20000页,2000万字以上。而目前所获得的出版资助仅为2010年全国古籍整理出版资助项目的6万元,根据出版社核算,这点经费在出版该书第一卷郭店楚简卷过程中已经用罄。该书虽然也被列入“十二五”国家重点图书出版规划增补项目,但这只是有名誉无资金的项目。因此,该系列的后续成果如包山楚简卷等虽已交稿,但出版社尚无明确的出书时间安排。商周金文综类,全书共14卷,每卷篇幅为8开12001500页,全书总计大约8开25000页。该编纂系列虽然获得2012年全国古籍整理出版资助项目的34万元出版资助,但这笔资助却只是该书