
总第25卷第2期SOIAL SCIENCES REVIEW VOL.25NO.2
计算机网络发展到今天,古籍的数字化无疑是不可避免的。抛却网络上出现的数字书籍不说,现有几部大型电子古籍的出现——
—《四库全书》、《四部丛刊》、《十通》、《历代石刻史料汇编》、《大清五部会典》、《大清历朝实录》,在很大程度上帮助研究者推进了学术研究的进程。数字古籍作为一门不算新的研究领域被很多学者看好。但是,正如数字古籍表现出来的优点,它的缺点也同样明显。分析数字古籍在古典文学研究中的利与弊,将有助于学者在古籍研究中趋利避害。
一、数字古籍与古籍标点
虽然,我们已经开发出来了《四库全书》、《四部丛刊》等大型的数字古籍,但是我们还没有将计算机标点技术运用于数字古籍,只是对计算机标点古籍寄予很大的希望。在中国浩如烟海的古籍中,目前被标点的古籍毕竟只是少数。这么庞大的工作如果只靠人工来做的话,不仅费时,而且也不可能在短时间内出现高品质的标点作品。因此,研究者将越来越多的希望和关注目光投注到数字古籍方面。
专家们认为计算机的智能化是完全可以实现古籍的标点的[1]。表面上看来,数字化古籍标点是切实可行的设想和计划,但是,在实际的操作中还是比较难以实现的。通常的做法是借助于古汉语语法规律,和字与字之间的亲和度来进行的。尽管专家们希望通过了一系列的方法让计算机掌握古汉语语法,藉此实现计算机标点智能化的愿望①。但是这仍然存在问题。此种标点正确的前提在于知道此文体为何种文体,可是七言体律诗毕竟是比较容易定义宏和易于掌握的文体。如果是一些其它文章,即不是纯粹的四六体,也不是比较容易的散文,我们如何来标点呢?明代文体学比较发达,吴讷的《文章辨体序说》和徐师曾的《文体明辨序说》于书中都有比较详细的记载。每一种文体根据其最初的样式和发展的实际情况,都有所因革。以赋体为例,从题材上来看,有叙事和抒情两大类;从体裁上来看,有古赋、骈赋、俳赋、文赋之分;从源流上来看,又与骚体、七体有关;从时间上来看,先秦之赋不类于两汉、三国、六朝、唐宋之赋。总之,从草创到定型到成熟到通变,任何一种文体都不能简单地定论,标点其实并不容易。如果标点错误的话,很容易引起句意理解上的差池。中国古代作品的文体问题,是与时代、文风紧密相联的,并不是一种模式可以解决的。如果我们忽略了任何一种文学作品都是在文学史的发展变动中形成的,忽略了通与变这个贯穿着整个中国古代文学创作的特点,标点任何一种文体都是不切实际的。如果是这样的话,可能计算机智能库就需要更多的内容,不仅仅是某种文体的特点,而且要包括每一种文体在每一个历史发展阶段的特点。
当然,在这里我们并不是否认计算机智能标点的发展前景,计算机完全可能通过掌握古汉语标点和语法的方法,对标点出来的文本进行纠错,因此,完善的纠错系统可以给学者的研究提供可借鉴的平台,降低研究过程中的差错率,增加研究成果的正确性、可信性。
因此,我们说古籍数字化标点在具体地实施过程中有很多问题,但是,大批量地标点和实施是事在必行的举措。就文化普及的层面来说,现有的标点书籍已经足够。但就古典文学研究的角度而言,远远不够。我们并不提倡事必恭亲,数字古籍的标点,还是要和人工相结合,计算机标点难免会出疏漏之处,计算机标点的出现不能以失去人工标点的能力为代价。
二、数字古籍与古籍版本笺注
数字古籍在古籍版本比较和笺注方面的介入,将大大推进古籍版本和古典文学研究的进程。我们都知道,研究不
古籍数字化与古典文学研究
(大连翻译职业学院辽宁大连116600)
【内容摘要】古籍数字化是网络科技发展的必然结果。数字古籍在古籍的标点、版本、笺注、古典文学研究及古典审美方面显示出较强的发展势头和前景。人们希望计算机和古代文学两个学科的结合,能开出娇艳的花朵。但是,数字古籍的发展仍然是利弊并存的。
【关键词】古籍数字化古典文学古典审美
中图分类号:I206.2文献标识码:A文章编号:1007-9106(2010)02-0098-03
*作者简介:(1979-),女,北京师范大学古代文学专业博士,大连翻译职业学院讲师。
同的版本会得出不同的结论,那么,到底哪个版本可信,哪个版本接近于作者的最初想法?借助计算机的分析和统计,或许可以解决这方面的困扰。而且,这个方法将避免了大量的人力、物力和财力的浪费。以《红楼梦》为例,如果数据库可以提供各《红楼梦》的版本,并通过比较,将各版本的异同显现出来。这就方便解决了人们在研究《红楼梦》时因版本差异而出现的理解不同的问题,同时也更有利于正确观点的形成。与此同时,我们也可以通过纠错勘正系统,利用已经存在的成熟的研究成果,对各种版本进行刊校,选出最好的研究底本,而其它的版本作为辅助性的研究而存在。
这对于古典文学研究来说裨益良多。一是研究者无法占有那么多版本的信息,收集起来也非常困难,有些版本即使走遍各大图书馆也不可能得到。以《千家诗》研究为例,黎恂选注的《千家诗》对刘克庄和谢选王注本的《千家诗》的流传有所记载,是研究《千家诗》比较重要的版本②。但是,这个版本只有在国家图书馆中才能找到,非常稀有,这无疑给研究者的研究带来了很大的不便。另一方面,古籍版本数据库的存在,也省去了研究者将大量地时间放在版本校勘方面。往往沉浸在庐山之中,入得其中而出不来,难识其真正面目。各古籍版本数字化的实现,解决了研究中的人力,节约了时间,但如果我们得出的结论是肤浅而没有深度的,这无疑是浪费了古籍数字化的资源。因此,从另一角度来看,古籍版本数字化的现实对人类分析解决问题的要求更高了。
在提供的各种版本中选择一个优良的版本作为底本,确定几个参校本与底本进行比对。同时,从各类总集、选集、类书、方志、其他人的文集中辑出逸作。综合以上因素,我们就可以对某个主要版本进行笺注。古籍笺注数字化,具有人工笺注无法比拟的优点。人工笺注往往速度很慢,很多疑难字查不出出处,难以理解无法笺注,或者理解错误、笺注错误。而计算机笺注可以通过建立冷僻字库、词库、典故数据库来解决笺注过程中出现的疑难字问题。通过对数字库中相同或相近字词的查找,可以成功地解决笺注过程中因学识不足、理解不到位所带来的缺漏和错漏问题。
毫无疑问,数字古籍的出现推进了古籍的版本研究和笺注的准确性,这不仅是对古籍研究的一次,也是对学者头脑的一次,无疑将引发一场古典文学界的新的头脑风暴。
三、数字古籍与古典文学研究
数字古籍的出现,无论是何种格式,即使是最简单的电子书,都在很大程度上方便了研究者,弥补了研究者因藏书不足带来的缺憾。尤其是一些先进的数字古籍具有检索功能,给研究者的研究带来了极大的便利,其中之甘苦恐怕只有研究者才能道出[2]。
研究古典文学的专家都知道,通常我们言有易而言无难。在浩瀚的古籍中,我们想举例证明一个观点是存在的,这比较容易。但如果你想证明某个观点是不存在的就比较困难,如何才能穷尽所有的资料来证明你的观点呢?古籍数字化的检查功能,为此提供了可能。如果我们的数字古籍有一个强大的数字库的话,那么我们只需要在检索项内添上我们所需要查询的东西,轻轻地敲个回车即可。这种检索功
能,不仅为我们提供了研究所必须的材料,而且,在材料的构成方面要比人工检索方便而且正确得多。
但是,目前数据库的检索功能并不是十分完善。以《四库全书》为例,数据库的检索功能尚未实现检索的智能化。有很多的相似的检索条件还不具备,如果我们搜索杜甫,和杜甫相关的,如杜工部、杜子美等信息不会一起出现。在实际的研究中,可能后者代表的信息要比前者重要得多。这就需要研究者在运用数据库进行研究的时候,一方面需要掌握完善的知识,另一方面也需要掌握检索的方法,如此才能得到最接近于研究想要的结果。
不言而喻,数字化古籍在检索方面的优势是非常明显的。数字化古籍的检索功能确实节省了研究者在研究过程中的人力、物力和财力。但是,我们要清醒地认识到数字古籍在古典文学研究中的作用。虽然,数字典籍的搜索功能为研究者的研究提供了便捷正确的资料,这在某种程度上对研究者是种,但同时危险系数也很高。如果,研究者的数据都是靠数据库搜索而不是亲自读取得来的,也许可能数据的真实性很高,但解释可能是片面、错误的。古籍数字化的出现,方便了大多数的学者。学者越来越多,但称得上大师级的人物越来越少。虽然,以前的学者也无法穷尽所有的文史资料,但是用功至深的大家们,用他们自己的方法,探索出了古典文学研究的治学之路。古籍数字化的今天,我们仍然需要一些英雄人物的出现,来改变大师贫瘠的年代,仍然需要秉承着胡适先生“大胆假设,小心求证”的汉学路子来实现古典文学的研究。
四、数字古籍与古典审美
尽管数字古籍在古典文学研究方面存在着缺点,但是毕竟优点仍然是很明显的。古典审美则不同。正像很多专家学者所认识的那样,古籍数字化在古典审美方面的优势还是明显存在缺欠的。就像郑永晓学者提到的那样,计算机在区别唐诗和宋诗方面的优势,还是不像它在检索方面那么突出[1]。
从大体的风格上讲,唐诗和宋诗的风格还是有明显的不同的。“唐诗以情韵、气格胜。宋苏、黄皆以意胜,惟彼胸襟与手法俱高,故不以精能伤浑雅焉。”[3]通过字段的分析,古籍数字化可以确定某种风格属于唐诗,某种风格属于宋诗。那么,是不是因此我们就只需要了解所谓风格、意象上的“唐诗”和“宋诗”,而不需要研究以时代划限的“唐诗”“宋诗”呢?其实,我们在宋诗中也会轻易地发现风格近似于唐诗的诗歌。虽然,一个时代的文学,与一个时代的文风、文体紧密相连,但是,后世的文学家也会通过模仿创造出与前代作品风格相似的作品,尽管这一风格特点与它所在时代的整体风格是异趣的。“杜诗雄健而兼虚浑。宋西江名家学杜几于瘦硬通神,然于水深林茂之气象则远矣。”“诗能于易处见工,便觉亲切有味。白香山、陆放翁擅场在此。”“西江名家好处,在锻炼而归于自然。放翁本学西江者,其云:‘文章本天成,妙手偶得之。’平昔锻炼之功,可于言外想见。”[3]宋诗以学杜为主,江西诗派影响了整个宋代诗坛,但仍然会有陆游这样的高手创作多样而自成一派。
但是,在研究主流风格的同时,我们也(下转第107页)(上接第99页)应该关注一下非主流诗歌。《唐诗三百首》中题为唐人张旭所作的《桃花溪》实为宋人蔡襄所作之《渡南涧》[4]。从作品的风格来看,实有唐人之风味。故清代的黄生说:“长史不以诗名,三绝恬雅透润,盛唐高手,无以过也。”(《唐诗摘钞》卷四)固然一代有一代之文学,但文学的魅力就在于其变化莫测的艺术价值,以蔡襄之人品竟也能做出如此具有意境的诗歌,足以见得宋人之学识、宋人之雅质。这反而从另一个侧面丰富了宋人的生活意境与层次。
但是,我们可以通过检索等功能,来确定唐诗或宋诗中的某些惯用词汇[2]。这对于古典文学研究和审美还是有一些帮助的。但是,每一种文体有某种相对固定的样式和特点,在不同的历史阶段,会表现出不同风格和特点,这是古典文学也是文学史研究的一个乐趣所在。这些审美的、感受的东西,是无法通过古籍数字化准确得出来的。利用现有的技术设计程序根据题材、用韵、格律、字频、词频、用典等数据来对唐宋诗的异同予以比较,根据计算机产生的数据和所描绘的曲线对唐宋诗的区别做出一个比较精确的判断,这些数据都还是外在的,而钱、缪二位学者给出的却是审美上的、直观的、感受的,当然也是理性的评价[1]。应该说,我们利用数字感知的目的就是为了得出类似于钱、缪二位大师这样的有分量的话,而不仅仅是做出一些数据,分析一些外在的东西。当然了,这些数据是必不可少的,对我们的研究是很有用的。艺术审美是古典文学研究的一个重要方面,我们需要研究者,同时我们也呼唤有艺术审美力和创造力的文学大家,一个激情的时代需要理性,同样一个理性的时代,不能没有感情,我们可以在那些细微地体察中找到久已不
见的自我。一些更贴近自然的人性,一些更近于感性的领悟。正如司空图《与极浦书》中说:“戴容州云:
‘诗家之景,如蓝田日暖,良玉生烟,可望而不可置于眉睫之前也。’象外之象,景外之景,岂容易可谈哉!”
要之,古籍数字化加快了古典文学研究的步伐,同时也彰显了当前古典文学研究的成就与缺撼。在古典文学研究的过程中,对古籍数字化的趋利弊害,将丰富古典文学研究的范畴,推进了古典文学研究的进程。
注释:
①郑永晓学者提到了利用设定“宏”的方式来标点七言律诗。参见郑永晓《古籍数字化与古典文学研究的未来》,《文学遗产》,2005(5),132.
②参见李连昌《〈千家诗〉版本简析》,《贵州文史丛刊》,2004(1)。郑珍《黎恂千家诗注》序称:
“宋刘后村千家村(诗)选,世弆家闻尚有其书,顾未之见也。”“故村郭村僻,书儿知诵四子以上,鲜不读者,即妇人女子,亦往往都能倍记,诗选在南中,盖未有脍炙如此本者。”
参考文献:
[1]郑永晓.古籍数字化与古典文学研究的未来[J].文学遗产,2005(5).
[2]李铎,王毅.关于古代文献信息化工程与古典文学研究之间互动关系的对话[J].文学遗产,2005(1).
[3][清]刘熙载撰.袁津琥校注.艺概注稿[M].中华书局,2009,327.
[4]莫砺锋.《唐诗三百首》中有宋诗吗?[J].文学遗产,2001(5).
失败。想必是“阶级斗争”这个创造历史的原则让中国人看到了希望,而把它当做了救主,把中国尽快从落后和苦难中解脱出来的希望寄托在了它的身上;1949年以后,在相当的时间里阶级斗争也始终都演奏着主旋律,“毛不仅一直把阶级斗争作为取得民主胜利的武器,也一直把它作为社会主义建设的动力”[10](P1)。所以正是马克思主义理论中的阶级斗争的学说使中国人靠近它、选择它、依赖它。
参考文献:
[1][法]让·马雷,阿兰·乌鲁著.社会党历史——
—从乌托邦到今天[M].北京:商务印书馆2000,8.[2]孙中山.三民主义[M].湖南:岳麓书社,2000,171.
[3]陶大镛.社会主义思想史前记[M].上海:士林书店三十八年.
[4][德]李博著.汉语中的马克思主义术语的起源与作用[M].北京:中国社会科学出版社,2003.
[5]埃德加·.西行漫记[M].北京:三联书店,1979,128.[6]张艳国.五四时期中国社会主义思潮的历史反思[J].史学月刊,1999(3).
[7]独秀文存[C].安徽人民出版社,1987.
[8]选集(第4卷)[M].北京:人民出版社,1991.
[9]马克思,恩格斯.党宣言[M].北京:人民出版社,1997.
[10]李锐论说文集[C].北京:中国社会科学出版社,1998.
