《金瓶梅》版本和其他四大名著相比,比较简单,只有三种,即崇祯本、词话本和张竹坡评本
张竹坡评本以崇祯本为基础加评语,实际属于崇祯本系统,因此《金瓶梅》也可以只分为词话本和崇祯本两个系统
词话本即《新刻金瓶梅词话》100回十卷,为明万历年间刻本,因为书名中有词话字样,因此一般称为词话本
崇祯本即《新刻绣像批评金瓶梅》100回二十卷,为明崇祯年间刻本,因此一般称为崇祯本,有插图二百幅另还有内阁文库本系列,但实际是崇祯本的修订本
张评本即《张竹坡批评第一奇书金瓶梅》,刊刻于清康熙三十四年,是以崇祯本为底本,文字略有修改,主要增加了近十万言的总评、回评和读法等评论
考虑到词话本和崇祯本都没有批语,只有张竹坡本有批语,因此张竹坡本批语没有比对价值了
而张竹坡本在文字上又与崇祯本基本相同,再把张竹坡本文字和词话本、崇祯本进行比对也意义不大因此《金瓶梅》文字比对本目前只做词话本和崇祯本的文字比对,没有批语
这些人并不从事版本研究,只需要对于各种小说的各种版本的差异有个大致了解,只要知道版本分类大致情况,和版本之间的大致差异就可以了,不想了解版本更详细内容
如对于《金瓶梅》版本只要知道《金瓶梅》版本有三种,每种的大致情况就可以了这是古代小说一般研究人员和学生
对于这部分人,只要看相关版本研究的资料即可,不必为他们提供专门版本研究资料
第二类人对版本有兴趣,需要知道一些详细情况,但不进行深入研究
这些人也并不从事版本研究,但不只是对于各种小说的各种版本的差异有个大致了解就可以了,还想知道版本更详细内容,有时由于研究的需要,也可能需要仔细了解某部小说的版本差异的一些细节情况,但又不想知道太详细了
这些学者无需像版本研究学者那样细致了解各种版本的差异,不像版本研究人员要求那样深,但要求宽
如对于《金瓶梅》版本,不只要知道《金瓶梅》版本有三种,每种的大致情况就可以了,还要知道三类内文字的差异到底有多大?文字差异大致是什么情况
因此对于这部分人,应该提供对应他们要求的版本研究的专门资料,这样的版本资料只要使他们大致了解版本差异即可,最好是一个全面、概括、清楚、简介的资料,使得他们可以很方便大致了解版本文字的差异,无需进行仔细研究
对于版本研究的学者,要求是精和深,收入的版本数量越多越好
不止要大致知道各类版本的文字差异,还要研究各类版本内部的差异的演变,要研究版本细节
对于《金瓶梅》要研究词话本和崇祯本所有文字的细微差异
因此对这些版本研究学者,提供的版本比对要尽量细致,最好要做到逐字比对就要提供最完整、最详尽的版本研究资料
为此,针对上述第二类和第三类人员,利用数字化比对,分别制作和提供了分栏比对本和逐行比对本两种文字比对本
要针对不同使用者,完成《金瓶梅》两个版本文字的不同比对结果,最好的办法是数字化比对即先把两本文字数字化,再利用计算机对两版本的文字进行自动比对,文字相同的对齐,文字不同的错开
计算机比对有两种比对结果,有两种显示方式,分别适合上述两种用户
即一个版本占一栏,下面是词话本和崇祯本第四回部分文字的分栏比对结果(排版原因,表格省略)
上例描述西门庆和潘金莲初次见面,崇祯本比词话本增加了大段描写(排版原因、表格省略)
上例描述西门庆和潘金莲初次见面,崇祯本将词话本文字做了大幅度修改(排版原因,表格省略)文章源自 四大名著网:http://www.sdmz.cn四大名著-http://www.sdmz.cn/50914.html
上例描述潘金莲和王婆对话,崇祯本将词话本文字做了部分修改文章源自 四大名著网:http://www.sdmz.cn四大名著-http://www.sdmz.cn/50914.html
这种分栏显示方式可以清楚看出两本文字的大致差异,可以看出崇祯本对词话本文字做的很多删改但文字到底差别在哪里,实际并不十分清楚
即一个版本占一行,下面是词话本(词)和崇祯本(崇)第四回部分文字的逐行比对结果
词:妇人慌的扯住 他裙子便双膝跪下说道 干娘饶恕王婆 道你们都
崇:妇人慌的扯住她 裙子红着脸低了头只得 说 声干娘饶恕王婆便道你们都
-------------------------------------
词:要依我一件事妇人便道休说一件便是十件奴也依干娘王婆道从今日为始瞒着武大每日
-------------------------------------
词:休要失了大宫 人的意早叫你早来晚叫你晚来我便罢休若是一日不 末我便就对你武
崇:休要失了大 官人的意早叫你早来晚叫你晚来我便罢休若是一日不来 我便就对你武
-------------------------------------
崇:大说那妇人羞得要不的再说不出来王婆催逼道却是怎的快些回覆我妇人藏转 着头
-------------------------------------
词:干娘说便 了王婆又道西门大官人你自不用着老身说得这十分好事已都完了
崇:低声道来 便是了王婆又道西门大官人你自不用 老身说得这十分好事已都完了
-------------------------------------
词:所许之物不可失信你若负心一去了不来我也要对武大说西门庆道干娘放心并不失信婆
崇:所许之物不可失信你若负心 我也要对武大说西门庆道干娘放心并不失信婆
-------------------------------------
词:子道你每二人出语无凭 当各人留下件表记物件拿着才见真情西门庆便向头上拔下一
崇:子道你每二人出语无凭要 各人留下件表记拿着才见真情西门庆便向头上拔下一
-------------------------------------
词:根金头银簪又来插在妇人云髻上妇人除下来袖了恐怕到家武大看见生疑
崇:根金头 簪 来插在妇人云髻上妇人除下来袖了恐怕到家武大看见生疑妇人便不肯拿
-------------------------------------
崇:甚的出来却被王婆扯着袖子一掏掏出一条杭州白绉纱汗巾 掠与西门庆
-------------------------------------
词:收了三人又吃了几杯 洒已是下午时分那妇人便起身道武大那厮也是归来时分奴回家
崇:收了三人又吃了几杯酒 已是下午时分那妇人 起身道 奴回家
-------------------------------------
词:去罢便 拜辞王婆 西门庆踅过后门归来先去下了帘子武大恰好进门且说王婆看着
崇:去罢便丢下 王婆与西门庆踅过后门归来先去下了帘子武大恰好进门且说王婆看着
-------------------------------------
词:西门庆道好手段么西门庆道端的亏了干娘 智赛随何机强陆贾女兵十个九个都出不
-------------------------------------
词:了干娘手 王婆又道这雌儿风月如何西门庆道这色系子女不可言婆子道他 房里弹唱
崇: 手段王婆又道这雌儿风月如何西门庆道 色系子女不可言婆子道 她房里弹唱
-------------------------------------
词:姐儿出身甚么事儿不久惯知道得还亏老娘把你两个生扭仿 夫妻强撮成配你所许老身
崇:姐儿出身甚么事儿不久惯知道 还亏老娘把你两个生扭 做夫妻强撮成配你所许老身
-------------------------------------
词:东西休要忘了西门庆道干娘这般费心我到家便取锭银子送来所许之物岂肯昧心王婆道
崇:东西休要忘了西门庆道 我到家便取 银子送来 王婆道
-------------------------------------
词:眼望旌节至 耳听好消息不要交老身棺材出了讨挽歌郎钱西门庆道但得一片橘皮吃
崇:眼望旌 捷旗耳听好消息不要交老身棺材出了讨挽歌郎钱西门庆
|
这种逐行显示方式刚好和前面分栏显示相反,两本文字差异整体上不明显,但文字上下逐字比对,个别文字的具体差别十分清楚
2.词话本妇人便道休说一件便是十件奴也依干娘,崇祯本删除
3.词话本我只依着干娘,崇祯本改为羞得要不的再说不出来王婆催逼道:却是怎的快些回覆我?妇人藏转着头低声道:来便是了
4.词话本干娘这般费心我到家便取锭银子送来所许之物岂肯昧心,崇祯本改为我到家便取银子送来
至于崇祯本为何要做这些修改,就得人工再仔细分析了计算机文本比对只能提供文本差异
分栏显示中,版本文字差异整体情况显示清楚,一眼可看出两版本文字差异的大致情况但文字差异的细节不明显和清楚
逐行显示和分栏显示刚好相反,逐行显示文字差异细节清楚,逐行文字上下比对,可以清楚看出两本文字逐字的差异但文字差异的整体情况不如分栏比对清楚
比对本分别采用了繁体字和简体字两种之所以采用两种文字是因为两种文字的使用目的不同
繁体字保留了原本文字的原貌,同一个字可能有不同写法,即异体字、俗体字,繁体字本都保留下来,因为这些异体字、俗体字在版本研究中有时很有用
如果都变成正体字,就看不出这些变化了,对版本研究有时很不利因此繁体字本保留了各种异体字和俗体字是有必要的
但大量异体字、俗体字对阅读很不利,对版本比对也很不利对于主要是阅读的用户来说,保留这些异体字、俗体字没有多大意义
因此为了一般阅读需要,又制作了简体字本这样对一般阅读和文字比对就很清楚和方便了
因此,繁体字和简体字本各有各的用途,可适应不同用户用户可根据自己需要选择
《金瓶梅》版本数字化已经完成了四种版本,即词话本、崇祯本中的北京大学本、东京大学本和张评本
由于张竹坡评本是以崇祯本为基础加评语,实际两版本文字差异很小
崇祯本中的北京大学本、东京大学本文字差异也不大因此《金瓶梅》计算机自动比对只比对词话本和崇祯本的北大藏本两个系统
词话本和崇祯本两个版本分别录入了简体字和繁体字,又有分栏和逐行两种显示方式,这样计算机自动比对本最后就有四种结果:
这四种比对本开本有16开本(B5纸)和8开本(A4纸)两种因为每本书很厚,因此每本都分为上下两册
16开本书较厚,但开本略小而8开本相对较薄,但开本较大因为打印16开本和8开本每页价格相同,因此相对而言,8开本因为页数略少,因此略便宜一些总之,各种开本各有优缺点
这样四种比对本总计有8种形式四种比对本8种形式的篇幅、成本价格统计如下表(排版原因,表格省略)
如前所述,由于分别采用繁体字、简体字和分栏、逐行显示,就有四种比对本,这四种比对本是针对四种不同的用户如何使用繁体字、简体字和分栏、逐行四种比对本
一般用户阅读可使用简体字本,版本人员研究可使用繁体字本
在分栏和逐行比对方面,如只是想了解两版本文字的大致差异,可选分栏比对本如还想进一步了解两版本文字差异的细节,可选逐行比对本
一般研究版本差异,可先用分栏显示观察版本文字差异的整体情况,寻找问题
通过分栏比对发现问题后,再针对个别问题,用逐行比对显示方式,再逐字比对,仔细研究
因此把四种比对本都整理出来,读者可根据自己需要选择
第一,繁体字逐行比对本:专门从事版本研究,需要研究文字细微差异,可使用繁体字逐行比对本
第二,繁体字逐行比对本:专门从事版本研究,不需要研究文字细微差异,只要大致知道版本文字差异,可使用繁体字分栏比对本
第三,简体字逐行比对本:不专门从事版本研究,但需要了解版本文字的细微差异,简体字逐行比对本
第四,简体字分栏比对本:不专门从事版本研究,不需要了解版本文字的细微差异,只要知道版本文字的大致差异即可,可使用简体字分栏比对本
其实,得到此两种版本任意一种比对本,实际就等于同时获得了词话本和崇祯本,还可以看出两本差异,可谓一举多得
《金瓶梅》词话本和崇祯本简体字两种比对本在2016年广州第十二届国际《金瓶梅》学术研讨会曾作为样书,提交大会,受到一些金学专家的一致好评,认为这种比对本对于研究《金瓶梅》版本是个很方便的工具书
由于当时只是初稿,错误很多,只各带了一本,赠送给了最需要的学者
会后又对文本再进行了初步整理,在2017年云南大理《金瓶梅》研讨会上再提供给感兴趣的学者们
1、文字标点简体字本文字加标点,对阅读十分方便但比对中加入文字标点后,对检查文字差异很不利
比对主要是研究文字差异,不是为阅读,因此比对中都删除了所有的标点
2、异体字、俗体字《金瓶梅》文本最大问题是有大量异体字和俗体字,这些字多数在计算机字库中是没有的
如对文字要求比较高,这些字就得逐字造字,工作量极大考虑本书不是正式出版物,只是提供给学者参考,因此就用相近的字代替
3、色情描写一般正式出版时,《金瓶梅》中的色情描写都被删除了考虑本书是为学术研究所用,因此这些色情文字都予以保留
4、校对所有的比对文本都未经过仔细校对,如要正式引用,请务必再与原书核对
崇祯本有多种,包括:王孝慈旧藏本、北大藏本、天津图书馆藏本、首都图书馆藏本、日本内阁文库(现日本国立文书馆)藏本、日本东京大学东洋文化研究所藏本等
各个版本的插图中,王孝慈旧藏本、北大藏本插图质量较好
由于本书主要是用于比对研究版本的文字,插图只是辅助性质因此没有固定选用某个版本的插图,而是从上述藏本中,分别选用了图像质量比较好、比较清楚的插图,也就不再一一注明各幅插图的来源
崇祯本插图多数是单独成册本书为使插图和文本更紧密连接,便于读者阅读,没有把插图单独成册,而采取一般做法,把插图置于每回之前
词话本和崇祯本的两种比对本目前都已经整理完成,本书是为研究使用,不公开出售
如有人需要,可直接来信、来电联系告知需要哪种比对本,我可以打印成书后快递发出,只收成本费(见表2),快递费采用倒付,即由用户支付
如有出版社曾出版过词话本和崇祯本两种《金瓶梅》版本,也就有了这两种版本的电子文本,再用计算机进行自动比对,就可很快生成这两种比对本,因此要出版这两种比对本实际也是很容易的
如果出版社只出版过词话本和崇祯本中的一种版本,只要再校对出另一种版本,利用计算机也可自动生成这两种比对本
古代小说版本数字化后,除上述比对外,还可进行一些数字化的研究,如差异统计、同词脱文统计、句长统计、对话统计等,分别简介如下
词话本和崇祯本有两处文字差异很大,一处是第1回,一处是第53-54回
词话本第1回是先介绍武松打虎,然后再说西门庆、潘金莲而崇祯本第1回是直接从介绍西门庆开始,然后转入武松打虎后被迎接回县城,没有讲述武松打虎的过程
第1回词话本和崇祯本简体字差异为28.99%,两个版本文字差异太大,如直接比对没有任何意义,为此第1回文字不做比对第2回词话本和崇祯本差异为83.03%,文字差异较小,因此做了比对
词话本第1回末尾讲潘金莲勾引武松,武松痛斥后搬出武大家而在崇祯本中,这部分是改在第2回开头这是因为崇祯本因为删去武松打虎,第1回文字减少,为各回文字平衡,就把词话本第一回末尾这段故事改到崇祯本第2回开头了
为比对清楚,就把崇祯本第2回的这段文字,挪到第1回结尾,这样就可以比对两本的这段文字了
词话本和崇祯本另一处文字差异大之处一般认为是第53-57回,对此很多学者进行了分析
其实仔细比对这几回崇祯本和词话本简体字文字差异结果如下:
第53回:4.24%,第54回:3.54%,第53-54回文字几乎完全不同
第55回:44.64%,第56回:66.8%,第57回:70.3%,第55-57回文字差异从44.64%到70.3%,从不到一半,到70%,部分文字相同
因为第53-54回文字差异太大,文字不做比对第55-57回部分文字差异差异不是太大,因此还是进行了比对
下面是利用计算机自动计算出的崇祯本和词话本简化字、繁体字各回文字差异
繁体字差异都比简体字小,这是因为有多种繁体字对应一个简体字,因此简体字差异就减小了(排版原因,表格省略)
以上对词话本和崇祯本各回文字的繁体字和简化字的差异进行了计算,下面以繁体字为例,进行初步分析
根据词话本和崇祯本差异计算结果,100回可分为以下三类
第1回(15.84%)、第53回(3.51%)、第54回(2.81%)的差异都在20%以下,这是由于崇祯本文字做了大幅度改写,导致差异大大下降
第55、74、66、73回差异分别为39.39、48.78、52.8、54.631%,这是由于崇祯本删除了词话本大段文字,两本文字都有较大差异,导致差异下降
100回中差异最小的3回是:第88回陈敬济感旧祭金莲 庞大姐埋尸托张胜83.37%、第32回李桂姐拜娘認女 應伯爵打渾趨時83.67%,和87回王婆子貪財受報 武都頭殺嫂祭兄84.52%这3回崇祯本文字几乎没有改动
除上述介绍的几回以外,100回中其他各回差异都在60—82%之间
同词脱文是中国古代小说中经常发生的事情小说在抄写或刻印中,当同一词出现两次而位置很近时,由于疏忽,很可能会将第二个词看成第一个词,而将两个词中间的文字遗漏掉,称为同词脱文或串行脱文
同词脱文是小说研究,特别是版本演化分析的一个有力手段,在古代小说版本研究中被广泛采用
在《三国演义》版本研究中,英国魏安用人工统计所收集到的35个版本,共发现154处同词脱文,以此对《三国演义》版本演化进行了详细分析,得出了《三国演义》版本演化图
另外,在目前《红楼梦》热点问题程前脂后的论战中,同词脱文也是一个重要的分析研究手段
有人也是利用人工方法,统计庚辰本和程甲本的同词脱文,共发现120多处
传统人工进行多个版本同词脱文分析是非常繁琐的事情,效率极低,要准确统计和比较两个版本之间的同词脱文,是非常困难的事
而用计算机代替人工比较和准确统计两个版本之间的同词脱文,是非常容易的事,效率大大提高,在这方面,最能发挥计算机的优势数字化同词脱文为学者研究版本提供了一个有利的工具
用计算机统计《金瓶梅》词话本和崇祯本的同词脱文,总计有15处,都是崇祯本出现了同词脱文,而词话本没有任何同词脱文这说明崇祯本晚出,其文字是修改过的,有脱文,因为要词话本后出就要增补这些文字,这是十分困难的
词话本:嫦娥偷汉子这婆子端的惯调风月巧排常在公门操斗殴这婆子正开门在茶
词话本:不知往房里去了俺姐儿一日脸不知匀多少遭数要便走的匀脸去了诸般都好只
词话本:苦这等费心月娘递了酒经济傍边坐下须臾馔肴齐上月娘陪着他吃了
词话本:道爹若这等才好休放他在家里使的他马不停蹄才好正说着西门
词话本:八羔子学舌打了他小厮说他小厮一点尿不晓孩子晓的甚么便唆调打了他恁一顿早是
词话本:每 冬衣了正是恨小非君子无毒不丈夫毕竟未知后来何如且听下回分解正是只恨闲愁成
词话本:在外边伺候西门庆即令与我叫进来不一时把六名乐工叫至当面跪下西门庆向伯爵道他
词话本:起思量起怎不上心伯爵道揉着你那痒痒处不由你不上心无人处无人
词话本:是小的妹子西门庆问你们吃了酒饭不曾周采道小的刚才都吃过酒饭了西门庆因一回想起
词话本:酒四样下饭西门庆看贴儿上写着眷晚生王宷顿首拜西门庆即便叫王经
词话本:一百本历日西门庆叫了陈经济来问了四包银子已久交到后边去了西门庆走到厅上春
词话本: 乞我把贼瞎淫妇一顿骂立撵了去了若不是大妗子劝着我验上与这贼瞎淫妇两个耳刮子
词话本:上 腹溶溶被翻红浪那阵上刷刺刺帐控银钩被翻红浪精神健
词话本:管上下尊卑一个气的吁吁犹如牛吼柳影一个娇声历历犹似莺啭花间一个椅上逞雨意
词话本:高遮了太阳薛嫂道孩儿出了痘疹了没曾妇人道何曾出来了还不到一周儿哩薛嫂道春梅姐说爹
小说版本数字化以后,就可利用计算机对文本的句长和对话进行统计句长是指两个任意标点之间句子的字数,对话是指对话文字在全部文字中的比重
古代小说版本数字化是研究古代小说版本的重要工具,计算机自动比对可以显示出版本的文字差异,所有文字差异一字不少,全部可显示出来
计算机自动比对可大大减轻人工比对的劳动,使得学者有更多时间和精力,去从事版本的研究工作
纸本出版物可以清楚显示各个版本的文字差异,对了解主要版本的整体差异很有帮助
当然数字化也不是万能的,数字化比对结果最终还是需要人工去研究分析
计算机只能显示文字差异,而无法进行分析,分析研究还需要人工来进行因此对数字化既不能否定,也不能估计过高但数字化肯定对版本研究有很大帮助是不可否认的事实
本文由中国《金瓶梅》研究会授权刊发,转发请注明出处
文章源自 四大名著网:http://www.sdmz.cn四大名著-http://www.sdmz.cn/50914.html