关于编纂历时性汉语新词典的设想(下)基于中外一些语文词典比较借鉴林穗芳
六、年代标示法 能解释含义和用法的汉字是词或词素,从出土甲骨整理出来的单字约4600―4700个,迄今能辨识的有一千几百个。这些字收入词典中以见于甲骨文的年代为始见年代,在字头后标明。词义的始见年代一般以第一个用例的年代来表示。为确保义项能严格按照年代顺序排列,每条用例前都标示出现年代。年代统一用公元表示,以年份为基本时间单位。凡能确定年份的用年份表示(如1945),不能准确地确定的在某一年前加“约”,或者扩大时间范围。如:1945―1949、20世纪40年代、20世纪、19―20世纪。世纪还可以依照习惯采用三分法,分早期、中期、晚期。如19世纪以1800―1829为早期、1830―1869为中期、1870―1899为晚期,其他世纪类推。年代也可分初期、中期、末期。为节省篇幅,可考虑用国际上较 通行的、表示年代的符号代替汉字。下面是拉丁字母符号和汉字的对应关系。 “c”和“a”分别是拉丁语circa(约)的缩写和ante(不晚于、在……以前)的缩写,用斜体字。C是century(世纪)的缩写。AD表示“公元”,BC表示“公元前”,英语中通用。E、M、L分别是英语early(早)、middle/mid(中)、late(晚)的缩写。C、AD、BC、E、M、L均用小号大写字体。原来曾考虑用汉语拼音的缩写,如“19sj”表示“19世”,“19sjzq”表示“19世纪早期”,“y1945”表示“约1945年”,“q841”表示“前84年”。后来想这徒然增加记忆的负担,即使学过汉语拼音的人,不查词典缩略语表也不会知道这些字母代表什么,不如用国际通用的缩略符号。学过英语或其他外语的人,不难把这些符号代表的意思记住。《大罗贝尔法语词典》用罗马数字表示世纪,与用阿拉伯数字表示的年份相区别,如20世纪初、20世纪中、20世纪末的表示法分别为d閎.XX 、mi l. XX 、finXX,这样就不必在数字后加“世纪”。我国读者不大习惯用罗马数字 ,似乎还是用阿拉伯数字加“C”的办法较好。 《夏商周年代表》(2000 年公布)所定的五帝年代“约前30世纪初―前21世纪初 ”《现代汉语词典(汉英双语)》外研社2002年版译为“c.30th centuryB.C.c.21st century B.C.”,没有把“初”字的意思译出。“初”即初期或早期,通常译为“early”,添上两个“early”,译文便很长。如果年代都用缩写符号表示,“约前30世纪初―前21世纪初”的表示法可简化为“c.E30E21C.BC”。 有些字在最初使用时其含义不能确定,词典只能依据后来的书证来阐释。例如“共”字在公元前922年用作周共王的名号,在公元前841年用于年号“共和”,但从这两个用例得不出“共”字表示“共同具有或承受”的意思,表示这个含义的第一个用例《汉语大字典》和《汉语大词典》均引自《论语·公冶长》,于是字的始见年代和据以概括其本义的用例出现年代便有先有后,需要分别标注。 殷商甲骨文《甲骨文合集》分五期:武丁及其以前为第一期,祖庚、祖甲时代为第二期,廪辛、康丁时代为第三期,武乙、文丁时代为第四期,帝乙、帝辛时代为第五期。这五个时期可依照《夏商周年表》推定的殷代帝王在位年份用公元表示,上下限为前1300年和前1046年。在任何一种语言的基本词汇中,表示天、地、日、月、风、雨等自然界事物的词总是最先创造出来的。属于汉语基本词汇的词《汉语大词典》的用例多引自古籍今通行本。“雨”字在殷商卜辞中已常用,《汉语大词典》第11卷第611页《雨》条字头1义项 的第一个用例引自《易·说卦》、第二个用例引自韩愈诗,比实际使用时间晚了近千年。在卜辞中使用“雨”字较早的有商王武丁。如果选用他的一条卜辞补进释文,并标注字的始见年代 和用例年代,再加上词性,释文便可采用这样的编写格式: 雨1 aM13 C. BC[ y 《广韵》王矩切,上麌,云。] 从云层中降向地面的水。C12501191 BC《武丁卜辞》:“(占辞)王占曰:丁雨,不唯辛。(验辞)旬丁酉,允雨。”43 C.BC《易·说卦》:“雷以動之,風以散之,雨以潤之,日以烜之。”816 819韩愈《独钓》诗之二:“雨多添柳耳,水長減蒲芽。” “c12501191 BC”是《夏商周年代表》大致推定的武丁在位年份,共59年(据《 书·无逸》)。有学者考证,《易》的《说卦》篇“大致成于战国晚期”(宋会群、苗雪兰著《中华第一经梹棥粗芤住涤胫泄幕泛幽洗笱С霭嫔?995年版)。“4 3 C.BC” 指公元前4世纪至前3世纪,把《说卦》的撰写年代上推到战国中期、下延至汉初,实际撰成年代不会超出这个范围,确切年代有待词典编者研究确定。“aM13 C. BC”表示“雨”字的产生年代不晚于公元前13世纪中期。韩愈《独钓》诗作于元和十一至十四年间,换成公历为816―819年。 《现代汉语词典》(2002年增补本)比1996年修订本增添了新词新义1200余条。这些新词新义是根据大量的有年代可查的实际用例概括出来的,如果词典提供最早或较早的例证,读者据此可知这些新词大概产生于什么年代,凭老年人的亲身经历,也可以判断这1200余条新词新义大多数的产生时间不会早于20世纪晚期(1970―1999),例如“主页”不会早于20世纪90年代。大概是由于体例的原因,《现代汉语词典》增补本没有提供能显示新词新义产生年代的例证。这项工作不能留待后人去做,因为词典编者最清楚所提供的新词新义来自何时的语料。据抽查多种汉语新词新义词典,没有一种在体例上规定每个词条都尽可能提供早期例 证。例如一本2003 年出版的《当代汉语新词新义词典》,《主页》条只有释义,没有用例;《电子邮件》条提供了引自2000年5月7日《文汇报》的用例,显然太晚。北京科学技术出版社1985年出版郭于军编译的《英汉信息新技术辞典》收了《electronic mail 电子邮件》条,有500多字的中文解释,表明这个新词早在上世纪80年代中期已开始在汉语中使用。英、美、法国都有多种词典可以查到本国语言的固有词和新词新义产生于什么年代,可惜我国到现在还没有一种具有这样功能的词典。 七、充实例证数据库,具体交代引例出处,书末附引用文献目录 为便于比较借鉴,先介绍一下《牛津英语大词典》的有关做法。该词典第2版在最后一卷即第20卷卷末附有例证引用文献目录,分作者名和连续出版物名(报刊、丛书等),按字母顺序混合编排。作者名下列出所写作品,按所注明的撰写或出版年代顺序排列,连续出版物则只交代被引用的年份从何年至何年。文献目录共143页、约4.5万行(每页3栏、每栏105行)。据抽查平均每页大约有作者名和连续出版物名150条,照此计算,全书20卷使用的2436600条例证大约有2.1万个来源。一个作者写的书有一种至十几种不等,这些例证实际来自几万种书报刊。正文中引自出版物的例证交代书报刊名,原作分篇章的写出篇章名,直到页数。出处交代到页,这项规定十分重要,只有利用第一手资料和找到某种版本作为依据才 能查到例证在作品或出版物中的哪一页并记录下来,这就避免了用转引的办法可能产生的差错和缺陷,也为读者核查提供了方便。例如edit(编辑)+ing构成的editing一词的第一个用例: 1840 J. S. Mill. Let.16 Apr. in Wks ⅩⅢ.(1963)427 There, I think is a full account of all the world has got by my editing and reviews.是引自英国学者穆勒(严复译《穆勒名学》的作者)1840年4月16日写的信,出处改用中文表示则为: 1840约·斯·穆勒《书信》4月16日,载《(穆勒)文集》第ⅩⅢ 卷1963年版第427页…… 作为一种体例,释文首先交代引例写作年份,用黑体字;然后是作者名、作品篇名、写作月日,刊载于什么书,卷次用罗马数字,书的出版年份用阿拉伯数字放在括号内,括号后面的数字是书的页码,最后是引例原文。值得注意的是作品的写成时间和所依据的版本的出版时间分别交代(如果引自古代抄本,则只有抄本年份)。 本条目另一条引自《电影》杂志1963年4月号含有“editing”一词的用: 1963 Movie Apr. 32/2 A director shouldn’t use his camera and editing bench to impose something which he hasn’t been able to put into the action. 出处的交代法为“1963《电影》4月号第32页第2栏”。例证如果引自分栏排的报刊,通常交代到栏。如引自1955年5月9日《泰晤士报》含有“editio princeps”(拉丁语“抄本的第一个印刷版”)这个用语的例证著录方式为: 1955 Times 9 May 13/2 He published... an editio princeps of several minor works. “13/2”表示引例见于该天报纸的“第13版第2栏”。 《牛津英语大词典》正在进行全面修订出新版,即第3版,计划在2010年完成。新修订和新增补的条目从2000年3月起每季度在网上公布一批。新版主编称“以文献资料证明每一项词义首次有文字记录的用法”是该词典最重要的特色之一,在内容更新和修订的过程中请专家学者审查定义赖以确立的原例证的准确性,发现有更早的书证或原来使用的版本不符合现代图书著录要求,便改用更早的书证、更合适的版本。例如第1版《magnanimity》(高尚)条有一个用例摘自《愚人船》英译本,《愚人船》是德国诗人塞·布兰特在1494年创作的、当时风行全欧的著名通俗讽刺作品,在1509年由英国诗人亚历山大·伯克莱译成英文出版。《牛津英语大词典》第1版(《OED1》)和第3版(《OED3》)所用的书证原文分别为: 左栏是《OED1》该条目原用的书证,右栏是条目经过修订后收入《OED3》的书证。通过比较可以看出不同之处在于:1)《OED3》的书证引自Shyp of Folys(《愚人船》)最早的版本,即1509年初版;《OED1》使用年代较晚的1570年版。2)著作责任人《OED1》只写了姓BAR-CLAY,《OED3》加上名字缩写“A”。3)《OED3》写明是“伯克莱翻译塞·布兰特”的作品,《OED1》没有交代这一点,不了解的读者则可能以为这是伯克莱的著作。4)表示书证所在的位置《OED1》用的是《愚人船》1570年版的页码(page number)“206”,《OED3》则依照初版使用叶码(folio number),“f.ccxvii”的f是folio(叶)的缩写。西方印刷业初创时期书籍的印本依照中世纪的抄本的传统以叶为计算单位,一叶两面像我们的线装书一样只有一个编码,在叶码(ccxvii)后加“v”表示“背面”,如果加“r”则表示“正面”。在16世纪中期以后西方的印刷书籍才普遍改用页码制,一张书页两面印,两个页面(page)都有页码,正文页码用阿拉伯数字代替罗马数字。5)词目词在《OED1》的引证中的拼写法为magnanimitie,在《OED3》中按照所依据的引证把拼写法改为 Magnanymyte。6)引证的其他文字拼写法也有些不同,如《OED1》的引证“like to him can not be”的拼写法已同现代英语完全一样,《OED3》的 引证“lyke to hym can nat be” 则保持16世纪初拼写法的原貌。《OED2》是把《OED1》的原10卷正编和后来出版的补编、增编整合为一体,条目的释文内容基本上不作改动,上述《magnanimity》条的书证在《OED1》和《OED2》是一样的,现在出第3版才改动。P 英国早期出版的词典多为英拉、拉英、法英等双语词典,有些书在书末附有英语 词汇表。第一本独立成书的用英语解释英语单词的纯英语词典是伦敦学校教师罗 伯特·考德里(Robert Cawdrey)编纂的《按字母顺序编排的词汇表》(A Table Alphabeticall),于1604年印行。第一版有2543个词目,释义简明,一般不超过十个词,通常用同义词加以解释,主要解决英语常用的难词的含义、标准拼写法和词源问题,没有用例。1828年德国学者、《简明希腊语词典》主编弗·帕索(F. Passow)教授发表一篇论文提出一种新词典学的准则,强调使用按年代顺序排列的书证以阐明每一个词的历史。这个准则在后来欧洲大国陆续开始编纂的大型民族语言词典中得到体现。格林兄弟在1838年着手编纂《德语词典》,发展了这一理论。英国语文学会(British Philological Society,1842年在伦敦成立)在1857年11月听取会员R.C.特伦奇后来以《关于我们英语词典的一些缺陷》为题发表的报告。报告中列举当时的英语词典存在的七点缺陷是:废词的取舍没有一定的准则;词的系属关系往往不完全;对标示词的诞生没有给予足够的注意;对词的更早用法被忽略;对同义词的区别注意较少;本来可以用来阐明词的首次应用、词源和词义的许多例证被忽略;一部词典应当知道自己的界限(而不知道)。特伦奇认为一部词典是“语言的清单,词典编纂家是一位历史学家,而不是评论家”。在讨论了报告和征求会员意见之后,学会改变原来的计划,在1858年通过按历史原则编纂一部内容完备的新英语词典的决议,并开始招募志愿查阅者,为词典提供词目和书证。语文学会会长詹姆斯·默雷(James Murray)在1879年出任这部新英语词典的主编,印了2000份《向大不列颠、美洲和英国殖民地说英语和读英文的公众的呼吁书》在国内外散发,说“任何人,特别拥有现代书籍的人都能提供帮助”。效果良好,在美国约有500人、在英国约有800人响应,在1884年出版第一分册之前3年提供了例证约100万条。收集例证的工作先后约有2000人参加。词典编辑部把收到的每一条例证按照统一规格誊写在小索引卡片(6英寸?英寸)上,详细注明例证来源。这部《按历史原则编纂的新英语词典》(简称《NED》),1928年出齐,共128个分册,同年把若干分册适当合并,分成10卷印装发行(在1933年重印时正式改称《牛津英语大词典》,简称《OED》)。该词典编辑部现有四大资料查阅组。英国组和北美组每年向词典数据库提供例证约20万条。北美资料查阅组原设在牛津进行“遥控”,1989年在美国新泽西州莫里斯城设立办事处,直接招募和培训第一批正式的查阅人员,例证由手抄卡片改为用电脑著录,关键词加亮显示,从北美各地用电子邮件发到办事处,再传回牛津。历史组查阅近代早期至19世纪的文献。学术组则查阅第1版问世以后各国发表的有关英语词汇分析的学术论著。从1994年开始派十几个研究生到各图书馆查阅过去90年的学术著作,摘录所需材料。要是牛津的学术图书馆没有,便到伦敦、德国、荷兰、美国等地去查。此外,还同世界各国历时性词典编纂机构建立联系,利用它们收集到的有关资料。例如美国密执安大学为编纂近代早期英语词典(未完成)而收集到有关这个时期的例证近300万条,可以供《OED3》利用。只能在光盘 和网上得到的资料也广泛地搜集。编纂进度加快得益于现在已有许多地区性词典和断代词典陆续问世,其中有《美语词典》《加拿大语词典》《按历史原则编纂的南非英语词典》《澳大利亚国家词典》《古英语词典》《中古英语词典》等,使《OED3》时空都能更好地照顾。特别是《盎格鲁诺曼词典》的出版以系统的书证更清楚地表明了古法语、中古法语同中古英语的联系。从1995年1月起《牛津英语大词典》编辑部在自己的网站编发不定期的《牛津英语大词典新闻通报》,帮助读者及时了解词典修订进展的情况和存在的问题,呼吁国际学术界提供比已知证“更早的书证”(antedatings)或“更晚的书证”(postdatings),就自 己的研究领域对词典的内容提出改进意见。结果得到读者和专家学者的热烈响应,天天都收到来信或投稿。有时开展竞赛,对提供最多、最早或最需要的书证者给予奖励。《通报》可以用电子邮件发给需要的读者。每一期都有《求助表》,开列正在撰写或修订的词条,在哪些方面需要更多的书证。《牛津英语大词典》编辑部现有编辑42人,1993年以来有120个学者、研究助手、系统工程师和项目经理以及约200专业顾问和审读人员协助进行全面的修订工作。 生卒时间是历史人物传记不可缺少的著录项目。如果历时性词典把为词立传作为自己的追求,除了要追溯词的诞生年代之外,还得让读者知道废词、废义的消亡年代。《OED》采用的办法是:在废词、废义前加剑号( )作为消亡的标志,在释义后加缩写字“Obs.”表示已“废”;引例的第一条是已知的始见书证,最后一条引例是该词或该词义作废之前已知的最晚书证。这种标示词或词义的存废的做法值得借鉴。《汉语大词典·后记》说明编者先后从一万多种古今图书报刊中收词制卡,作为该词典确定词目和建立义项的依据,但未提及全书使用的例证实际有多少条,这些例证摘自多少种图书报刊。因为书末未附例证引用文献目录,读者不知道书中所引例证依据的是什么版本,要核对就不大方便。例如第10卷第1304页《邏輯學》条提供的惟一例证是引自黎锦明的《社交问题》,从人物传记词典和一般参考 书查不到作者是什么人,无从了解《社交问题》是一篇文章还是一本书,在何时发表或出版,怎样才能找到。又如第8卷第862页的《蚤服》条:“谓早已服从。蚤,通‘早’。《老子》:‘治人事天,莫若啬。夫惟啬,是謂蚤服。’一本作‘早服’。”不知道“蚤服”和“早服”各自依据的是什么版本。《老子》除通行的河上公注本和王弼注本外,还有其他多种版本,词典所依据的两种版本都须具体交代,以便读者比较“蚤服”和“早服”两种写法哪一种写法在先。版本不同,引例的其他文字也可能有所不同。如:1973马王堆汉墓发现的帛书乙本《老子·德经》作:“夫唯啬,是以蚤服”(马王堆汉墓帛书整理小组编《马王堆汉墓帛书》文物出版社1976年版);唐易州龙兴观道德经碑本作:“夫唯啬,是謂早服”。历时性词典似应首先引用已知的较早的版本(如帛书《老子》乙本),然后再引后出的版本或今通行本。据刘又辛查考,“先秦古文字和古籍中的确没有‘早’字,一律借用‘蚤’字”(《古书里的假借字》语文出版社2000年版),其依据之一就是帛书《老子》乙本用的是“蚤”字,可见交代引文依据的版本对学术研究是至关重要的。用“一本作”表示不同版本的异文,这种体例不适用于历时性词典,历时性词典须明确交代所用例证出自什么版本,其准确性要经得起读者检验。 我国历时性辞书的引证一般标明作者、书名、篇名或卷次、章节,戏曲注明折数和齣名,章回小说注明回数,但页数通常不交代。页数和版本有连带关系,不交代页数读者就无从了解引证所依据的版本,怀疑有差错也无从核对。现代作者(如巴金、臧克家)发表作品的时间先后可能相隔几十年,仅提供篇名,读者不能直接了解是何时发表的,刊载于什么书报刊。因此,新编的历时性汉语词典有必要参照《牛津英语大词典》的做法,例证的出处至少交代到书报刊的页数,被引用的书报刊名及作者名全部编入文献目录附在书末。有了这样的规定,引证所依据的《老子》的各种版本在引用文献目录中就得一一列出。作者不管是否知名,只要他的作品被引用,就应收入引用文献目录;从文献目录应能查到他有什么作品和有多少作品在词典的条目中被引用,被引用的作品是何时由什么出版社出版的,或何时发表于什么报刊。 八、编纂历时性汉语新词典的意义和工作方式 在数字化时代,辞书编辑怎样搞好选题开发以适应新世纪的要求,是编辑理论研究的一个重要课题。有统计材料说1978年至2000年我国辞书出版了8000多种。语文工具书也出版了不少,但选题往往重复。内容大同小异的成语词典已出版了200多种,现在仍有人在编。小字典大多数是在已出版的字典的基础上略加改造,缺乏新意。前两年笔者审阅一部已出胶片、准备出版的小字典,抽查了若干条目,发现释义部分有94%一字不改地抄自《新华字典》。另一方面,社会上欠缺但需要做艰苦细致的资料收集研究工作才能编好的词典却无人问津。例如,我们已有多种古汉语词典和现代汉语词典,而近代汉语词典迄今一种也没有,为什么?原因很简单:不好编,因为编近代汉语词典既要同古代词汇划界,又要同现代词汇划界,不能孤立地进行,需要查阅和占有现在已不易得到的近代原始资料,如鸦片战争以后、五四运动以前出版的书报刊等。编一部词典,给收入词典的所有的词(立目词)及其形音义的演变提供始见以来的书证并标明书证年代,是一个整体解决办法。有了这样一部历时性词典,再编各种断代词典或其他专用词典就不难了。在词典出增订版或出增编时必然会依照既定的体例给新添的词语加注始见年代。今后社会各界从事学术研究、编纂词典可以共享其成,不必另起炉灶去追溯每一个词的历史。可以说编出这样一部历时性汉语词典,将为编纂各种类型高质量的汉语词典奠定更坚实的科学基础。整个中华民族几千年的文明史将以词语历史的形式浓缩到一部词典当中,读者可以查到某一个年代有多少新词语、新事物、新概念在神州大地产生,中华民族的文化在某个年代处于什么样的发展水平,这是多么迷人的前景啊!他山之石,可以攻玉。下面把英国收词最多、容量最大的英语词典《牛津英语大词典》第1版(《OED1》)和第2版(《OED2》)同我国收词最多、容量最大的汉语词典《汉语大词典》(《汉大》)试作些比较。 编纂出版时间《OED1》用了70年,《汉大》用了18年。《OED》出第2版,卷数增加1倍,《OED1》和《OED2》分别出了补编或增编;《汉大》未出增补卷,2001年9月出第2版篇幅没有增加,把原12卷12册分装为22册。《OED》只收普通词语,包括进入日常生活的百科词语,不收专有名词(如人地名);《汉大》兼收普通词语和专名(如姓氏及地名、国名等)。《汉大》条目配插图2253幅以帮助了解文字不能形象地表达的概念,《OED》对词语的解说全部用文字,无插图。不收专名、不配插图,是《OED》明显的不足之处。《OED》字小密排开本大,1页的容量为《汉大》1页的2倍以上,一个词的例证数量普遍比《汉大》多几倍,甚至几十倍。汉语一个词平均为1.48音节,英语2个词译成汉语平均用3个字,《OED2》全书5900万个词译成汉语大约为8850万个汉字。《汉大》编纂出版所需时间不到《OED1》的1/3,原因在于:1)动手的时间晚了一百多年,社会发展水平、生产技术条件和编纂辞书的经验已远远胜过19世纪。2)由于我国政府的妥善组织安排,投入《汉大》编纂出版的人力、物力、财力之雄厚非当年力量还很薄弱的牛津大学出版社一家出版社所能比拟。3)缺少字形源流演变部分(按分工由《汉语大词典》来做),《OED》有词形源流演变部分。4)不要求提供始见书证,甚至不要求给每个多字条目和每个义项提供例证并给例证标注年代;以标注古籍作者所属的朝代(如北齐颜之推、唐韩愈等)来代替给例证标注年代,引用近现代作品不标作者时代和作品发表或出版年代。现在看来给每个义项提供例证以及给每条例证标注年代是编纂历时性词典的必经阶段,这个阶段是绕不过去的,绕过去在身后留下的是大片空白,我国迄今没有一部词典可以从中查到古今词语的已知始见年代。不补上这一课,把基础扎扎实实地打好,我国语文词典的编纂工作就不可能适应社会主义现代化建设的要求实现新的飞跃,赶超西方最权威的语文词典。 《牛津英语大词典》在1928年出齐时,牛津大学发布通告称:“本词典的准确性和完备性优于其他所有词典。牛津词典是最高权威,是无与伦比的。”1923至1937年曾三次出任英国首相的斯坦利·鲍德温把它誉为“这一行的最伟大的事业”。英美报纸称赞该词典是“有关英语和有关英语言语和思想从产生至今的历史的最高权威”(《泰晤士报》),“所有语言中最宏伟的词典”(《每日电讯报》 ),“有史以来从事过的最宏伟的词典编纂工程”(《纽约时报》)。如果把本文所设想的历时性汉语词典编纂出来,结果会怎样呢?试看下面的比较表: 附注:上表中“bef.”代表“以前”,如“bef.12 C”指“12世纪以前”;“fr.OE”指“源自古英语”,“fr.AF”指“源自中世纪英国法语”,“fr.L”指“源自拉丁语”。 左栏是中文词语及始见年代,根据笔者能查到的材料暂定。从“天”到“汝”等20个名词、动词、形容词、数词和代词引自《书·盘庚》。“夏商周断代工程” 测定盘庚迁殷时间时认为较妥善的年份是公元前1298年,《夏商周年表》取整定在公元前1300年。《书·盘庚》所记录的是盘庚迁殷之后和迁殷之前对臣民的讲话,是殷代的遗文,据信是在盘庚或稍后在小辛时由史官记录下来、至汉初用今文隶定的(其中可能有训诂改字),这些词的出现年代在表中用“E13 C. BC(前13世纪早期)”标示。右栏是对应的英文词语,始见年代据美国《梅里亚姆·韦伯斯特词典》第11版等英语词典标注。中文词语从公元前1300年起至公元2000年时间跨度为3300年,英文词语从能够给出的具体年代梹?2世纪算起,时间跨度为900多年。为什么英文词语的始见年份早于12世纪的不能具体给出而要用“12世纪以前”来笼统表示呢?问题得从《牛津英语大词典》当初的编纂方针说起。 英语史通常划分为:1)古英语时期,或称盎格鲁撒克逊时期(450―1150);2)中古英语时期(1150―1500);3)近代英语时期(1500年以后)。古英语和中古英语分界主要以诺曼人在11世纪征服英国为标志。现存最早的古英语文献是公元600年前后写成的。《OED1》收词范围为1150年以来使用的词语,包括从古英语传承下来、到中古时期仍然使用的一些词语。但不收1150年以前已废的词语,古英语词汇绝大部分在中古已成为废词,保存下来的古英语文献不多,一般读者不需要阅读。古英语最初使用的如尼字母(runic letters)不同于拉丁字母,古英语的名词、形容词、冠词还有性、数、格的变化(多达三性、五格);如照收,必须采取与12世纪以来使用的词语不同的处理办法,全书的编纂体例得另行设计, 词典的复杂性和编纂难度将大大增加。编者原来打算把中古以来全部英语词汇收入词典,后来认识到这是不现实的,确定把收词数量控制在合理的范围内。《OED》在词形的历史演变栏对“世纪”表示法,从古英语传承下来的词用“1”表示,把1100年以前整个古英语时期的各个世纪都包括在内,不具体指明是哪一个世纪;“12世纪”(12th c.)用“2”表示,“13世纪”用“3” 表示,“19世纪”用“9”表示,“20世纪”用“20”表示。各世纪的例证的比例大体为:12世纪和12世纪以前的占1%,13世纪1%,14世纪3.5%,15世纪4.5%,16世纪10%,17世纪16%,18世纪11%,19世纪31%,20世纪20%,其余为年代未定的词。 一种语言最基本的词汇在古代就已经产生,但是编英语词典如果利用《OED》的成果,在12世纪以前产生的词只能依据《OED》标注“before 12th century”(12世纪以前)和“from OE”(源自古英语)等;新编的英语词典除非自己收集原始资料进行独立的研究,否则不可能把古英语词产生的具体年代逐一标明。英国史上有一个著名的king(国王),称Alfred the Great(阿尔弗烈德大王,871―899年在位),仅据这一史实就完全可以把“king”和“great”两个词的产生年代定在9世纪或不晚于9世纪。但为了统一体例,《梅里亚姆·韦伯斯特词典》等英语词典对在12世纪以前产生的词只能依据《OED》标注“before 12th entury”或“bef.12C”(在12世纪以前);否则收入该词典的其他古英语词也得一一标注 具体年代,目前还没有一种英语词典能够做到。与great同义的large产生于12 世纪,属于中古英语,《OED》提供了始见书证,所以《梅里亚姆·韦伯斯特词典》等英语词典能标示具体年代。而我们汉语有足够的古文献资料作为依据,能把殷代以来3300年间使用的字词大约始见于什么年代一一查明。我们通过上表可知,与能确定年份的英语词比较,汉语的“民”比people 大约早2500年,“诗”比“poem”早2600多年,“算术”比arithmetic”早一千二三百年,“纸”比“ paper”早12个世纪,表示印刷概念的词比printing早800多年。在欧洲文艺复兴和工业革命以后,我国继续闭关自守,科学文化的发展开始落后,表示科学文化新概念的词语多从西方引进,产生时间自然晚于英语。如“几何(学)”“显微镜 ”约晚两个世纪,“火蒸机(蒸汽机)”晚84年,“教科书”晚98年。进入20世纪以来,由于中西文化交流较19世纪便利,汉英两种语言的科技新词语产生的相距时间已缩短到一二十年以至几年。如“电子”比“electron”晚21年,“激光”比“ laser”晚7年,“主页”比“home page”晚3―5年。法语史通常划分为:1)古法语时期(9―13世纪);2)中古法语时期(14―16世纪);3)近代法语时期(17世纪以后)。法语和德语现存最早的文献为法兰克王国查理大帝的两个孙子秃头查理和日耳曼路德维希在公元842年2月14日发布的《 斯特拉斯堡誓约》(法 Serment de Strasbourg / 德Strassburger Eide)。誓约以高卢罗曼语(法语的前身)和条顿语(德语的前身)两种文本写成,两人在城下与他们的士兵一起宣读。他们为与他们的长兄梹棥〔槔泶蟮鄣某に铩⑼跷?继承人罗退尔争夺权力和地盘结成的联盟导致《凡尔登条约》(公元843年)的签订,罗退尔被迫同意把王国一分为三:秃头查理领有的西法兰克王国后来发展成为法国,路德维希领有的东法兰克王国后来发展成为德国,罗退尔的领地发展成为意大利。公元842年被认为是文字记载有确切年代的法语史的开端,历时性法语词典给法语古词语定的始见年份没有早于这一年的,给名词“serment”和介词“de”定的始见年份就是公元842年。这两个词在口语中的使用必然早于公元842年 ,但词典只能以有书证的年份为准。P 法语第一部历时性词典是埃米尔·利特雷(蒻ile Littr椋┰?844年开始编纂的4卷本《法语词典》(Dictionnaire de la Langue Fran鏰ise),1863-1873年出版,1877年补编1卷,在20世纪多次重版。关于义项的排列顺序,该词典把词的最原始的意义而不是把最常用的意义置于第一位,后起义则主要依照逻辑顺序排列,各义项都举出所依据的书证。法国出版了多种古法语词典和历时性词典,如《古法语词典(至14世纪中期)》《中古法语词典》《古法语词源词典》《法语历时性词典 》《大罗贝尔法语词典》《法语宝库》等。法语词典能给公元842年以来使用的法语词逐一标明始见年代,比英语词典所能标明的年代——12世纪——早3个世纪。上述比较表中引自《书·盘庚》的20个词, 从《梅里亚姆·韦伯斯特词典》等英语词典只能查到一个词(large)见于12世纪,两个词(river和 people)见于13世纪,其余的词均笼统地标注出现在12世纪以前,没有分出先后。而20个与汉语词对应的法语词的始见年代从手边一部法国常用的《拉鲁斯莱克西斯法语词典》(Larousse Lexis Dictionnaire de La Langue Fran鏰ise,拉鲁斯出版社1975年版)可以一个不少地全部查到。依照在法语文献中的出现顺序,20个法语词依次为:842 je(予、我)、842 peuple(民)、880 venir(来)、880 grand(大)、890 feu(火)、900 ciel(天)、900 vivre(居)、c900 un(一)、980 vous(汝)、980 homme(人)、980 petit(小)、980 dire/parler(曰)、c1000 vieux(旧)、1080 montagne(山)、1080 champ(田)、1080 arbre(木)、1080 roi(王)、1080 nouveau(新)、1080 cinq(五)、1130 fleuve(河)。汉语词无法与英语词比较出现年代的先后时,可与法语词 比较。中古英语的许多新词,特别是来源于拉丁语的词,是通过法语引进的,产生年代晚于法语词。 人类创造了文字才开始脱离野蛮阶段,进入文明时代。人类文明最早发祥地两河流域苏美尔人和古埃及人在公元前四千纪先后以楔形文字和圣书字开创的文化比汉字文化更古老,但由于民族的迁徙、语言文字的变异,前者到公元1世纪、后者到公元7世纪便消亡了。古印度文明曾经出现过断层。古希腊罗马文明产生较晚,传世的文献不是很多,于今能直接利用的人很少。古罗马使用的拉丁语在中世纪早已为新形成的意大利语、法语、西班牙语等民族语言所替代。希腊曾长期沦于异族统治,到1830年才恢复独立。由于语言的变异太大,古希腊语词典和现代希腊语词典一般都须分编,不像汉语词典可以贯通古今。中国是世界上几千年来历史记载连续不断的惟一的国家,现存的典籍十分丰富,有可能依据从公元前13世纪起流传下来的文献给每一个词立传,给公元前841年以来使用过的词逐年标注始见年代或使用年代,用真实的语料说明它们各自有什么样的历史,在体现人类的认识水平上起什么作用。世界上使用汉语的人数最多,在现代的各种文化体系中汉字文化最悠久,有了这样的一部历时性汉语词典,世界各国人民不仅可以从最小的语言单位了解人类最大的民族共同体创造的文化几千年来如何由低到高的发展,而且可以很方便地以其中提供的有关信息作为参照点,衡量本国语言以词语形式表现出来的思想、文化和生活在各个历史阶段的发展水平梹椨胫泄冉鲜?于先进还是后进。通过比较还可以帮助探索各种语言的基本词汇产生的规律。笔 者原来以为表示自然界各种事物的词语的产生总是先于代词,为撰写本文查阅法语词典才知道代词“je”(予、我)在法语比表示“天”“山”“河”“火”等自然界事物的词产生更早,原因可能是:语言是人类交际的工具,为了与别人交流思想,让听话人注意自己在说话,总得使用一个词来代表自己,这样表示第一人称的代词便成为最早被创造出来的词语之一。盘庚在同一次讲话中使用“予”“我”“朕”三个词来代表自己,各有特定的使用场合。但比较表引自《书·盘庚》的20个词还是分不出产生年代的先后,编纂历时性汉语词典的任务就要查阅、研究包括甲骨文、金文等出土文献在内的各种资料,像历时性法语词典那样把作为词目收入书中的词语分出产生年代的先后,这20个词不可能都是“同龄词”。 编纂所设想的一部历时性汉语新词典是中华文化建设的一项基本工程,它将成为维系民族团结和国家统一的强大精神纽带,也将是人类有史以来最宏伟的文化建设工程之一,在世界辞书编纂史占有不可替代的地位。因为要对几千年积累下来的、各个领域有价值的文献进行全面的梳理、研究、利用,任务是极其艰巨的,需要投入人力、物力和财力之多将远远超过编纂任何其他一部书。国家的大力支持,学术界的密切配合,从各方面筹集到必要的资金,拥有一批具有远见卓识、愿意默默无闻地长年累月为此作出奉献的编辑人才,这些是保证这项文化建设的基本工程能够圆满完成的不可缺少的条件。 牛津大学出版社是世界最大的、历史最悠久的大学出版社,目前一年出书4500多种,包括辞书、教材和学术著作等。它成立500多年来所出的书中影响最大、社会效益最好的就是《牛津英语大词典》,编任何高质量的大型英语词典都离不开它。现任总编辑即第3版主编约翰·辛普森称这部词典是牛津大学出版社的“出版物中的旗舰”,不仅分量重,而且起导航的作用。尽管该书在出版历史上从未给牛津大学出版社带来商业利润,但为牛津大学出版社在英语辞书出版方面树立了世界性的权威地位。紧接1989年出第2版之后,该社又投入3400万英镑(5500万美元)于1993年启动全面修订计划,准备出第3版。该社一百多年来为这部大词典的编辑和修订再版积累了丰富的英语素材(在2002年初新建的“牛津英语语料库”已收集到当代英语使用的语料达1.1亿词次,用例样品全部摘自21世纪的文献),由 此带动普及性的中小型牛津英语词典和百科分类词典系列的编辑出版,在世界各地常销不衰,从中得到丰厚的回报。近年仅我国上海外语教育出版社第一批就引进了52种,其中有《牛津标准英语词典》《牛津简明英语语言词典》《牛津语言学词典》《牛津缩略语词典》《牛津英语谚语词典》《牛津英语词源词典》《牛津外来语词典》《牛津计算机词典》等。许慎撰成我国第一部字典《说文》比考德里编的英国第一部英语词典的刊行早15个世纪,前者的收字量为后者的收词量的3倍多。直到18世纪初《康熙字典》问世,我国语文工具书的编纂无可争议地处于世界领先水平。但此后到20世纪中期长达300多年间,我国仍然只有大字典而无大词典,词典编纂工作明显落后了。编纂历时性汉语大词典再创辉煌,将使子孙 后代受益无穷,必须着眼于长远,急功近利无法保证质量,使其达到这类词典的世界最高水平,为中华文化的伟大振兴、为丰富人类的精神宝库作出应有的贡献。 国外编纂出版第一部10卷以上的本国历时性语文词典往往需要几代人持续不断的努力。格林兄弟创始的《德语词典》从1838年起编纂,全书33卷34519页用了109年(1852―1961)才出齐。《牛津英语大词典》第1版编纂出版用了70年,到第四主编S.T.奥尼恩斯手里才完成,第一主编默雷(1837―1915)、第二主编亨利·布雷德利(1845―1923)在全书付梓前已先后去世。《荷兰语大词典》的编纂出版(从19世纪60年代起)用了135年。伊姆勃斯主编的《法语宝库》16卷本(全书约3000万个词),编纂用了34年(从1959年算起)、出版用了24年(1971―1994)。现在来新编历时性汉语词典因为已有《汉语大词典》和《汉语大字典》等雄厚的基础,许多古籍和现代文献已有数字化文本,检索便利,摘取例证不用手抄 ,编辑出版工作将可以大为缩短。西方辞书出版的经验教训表明,一部词典不可能把历史上出现过的词语囊括无遗,贪大求全只会使编辑工作旷日持久,不能按预定的计划完成;因此,全书的篇幅不宜过大,以控制在20卷以内为好,增添必要的新词语,对冷僻的在古籍中罕见的旧词语可适当减少以免篇幅膨胀。 收集、积累、分析和利用真实的语言材料是编纂词典的基础。现代计算机语料库不仅包含书面语文本,而且包含口语文本。经过加工的语料库的规模越大,词典的编纂质量越有保证。英国一家出版系列词典的大户柯林斯公司在伯明翰大学协助下建立的英语语料库——Bank of English收集英、美、澳、加的英语语料,据2003年8月29日英国《书商》周刊报道已达8.5亿词次。我国建立的语料库最大的也有几亿字。重要的是争取《汉语大词典》《汉语大字典》《辞源》《辞海》《现代汉语词典》《中国大百科全书》等辞书的编辑出版单位以及建有大规模语料库的高校与科研单位的参与,实现语料库资源共享。 词典的性质决定编辑工作必须打破传统的方式,向全社会开放,使读者参与全书的编辑过程。过去在内部编完一卷推出一卷,各卷有关的内容难以照应周全,有时甚至会出现自相矛盾的地方,例如《汉语大词典》的《中歐》、《南歐》和《東歐》条如果放在一起就会发现:罗马尼亚、阿尔巴尼亚、保加利亚既划入东欧国家又划入南欧国家,波兰、捷克斯洛伐克、匈牙利既划入东欧国家又划入中欧国家。新的办法是把词条稿分期分批在词典网站上公布,供读者试用并征求意见,编出一批公布一批。词条的主要撰稿人充其量不过一两千人,编辑有几十人就算是多的,而读者有亿万人,其中有各行各业的专家学者,只有依靠他们的帮助才能使词条内容更加准确完善。编辑需要什么资料、解决什么问题(比如为哪些新词新义提供更早的书证,为哪些废词废义提供更晚的书证等等),完全可以在网上具体说明,向广大读者求助。待全书条目编完后再考虑如何分卷和编制浏览检索系统,正式出版。印刷版应有按汉语拼音顺序和按部首笔画编排的两种版本供读者选择。电子版(光盘版和网络版)可参照西方辞书的做法增加印刷版所不具备的功能,比如:1)注音栏配男女声普通话和主要方言读音。2)按逆序查词目。即多字条目除从第一个字起按音序或部首笔画查外还可以像韵书那样按韵脚查,如键入“*书”即出现“兵书”“帛书”“草书”“辞书”“丛书”等,键入“*编”即出现 “长编”“改编”“汇编”“简编”“扩编”等词目,点击要查 的词目,立即显示该条目的全文。3)按年代查词目。试以杨衒之在东魏武定五年至六年撰写的《洛阳伽蓝记》(五卷)一书所用的新词为例加以说明。据研究该书的学者统计,书中收“菩萨”“佛殿”“都市”“高耸”“赞叹”等双音节新词670个。这些词可视为“同龄词”收入词典。 547-548东魏杨衒之《洛阳伽蓝记卷一·昭仪尼寺》:“并有二菩萨,趺上铭云: ‘晋太始二年五月五日十五日侍中中书鉴荀勖造。’” 547-548东魏杨衒之《洛阳伽蓝记卷一·永宁寺》:“浮图北有佛殿一所,形如太 极殿。” “菩萨”“佛殿”等词无论按音序或按部首笔画排列,在词典正文中都不会聚合在一起。给始见书证标注了年代,就有可能给词典电子版设置一个“按年代排列的词目表”(LIST BY DATE),使其具有查阅“同龄词”的功能,点击页面上的年代词目表图标或按钮,页面一侧立即显示本词典从《洛阳伽蓝记》和其他文献中选用了哪些在547548年出现的新词,再点击年代词目表中相近的年份比如“554年”,便可查到这一年出现的新词有“编缉”等,为编篡断代词典提供莫大的方便。 以上所述只不过是一个爱好辞书的读者表示自己希望看到什么样的历时性汉语新词典问世,纯属门外人谈,未知是否妥当。不揣浅陋把多年前就已萌发的设想在这里作较具体的陈述,是想抛砖引玉,期望出版界制定辞书出版规划时能注意到我国和全世界的读者都迫切需要这样一部词典,在适当的时机组织行家论证,共同研究制定一个切实可行的方案。(续 完) 2003年10月18日 (作者单位:人民出版社)
(ID:570)
|