本站自2005年开始,过刊仍然提供下载,新刊在半年内将不提供下载, 欢迎订阅
   Publishing Science    首页
湖北编辑学会主办  
 
2000年第4期  
 
目 录

卷首语
·现代出版的内涵
 
·责任编辑是什么
·地方出版社要注意地方特色
·我心目中的静山
·我看畅销书
·清江飞出的歌
·按需印刷 热点初现
·无垢经:中、韩学术论争的焦点
·燃烧生命铸编魂
·《美国出版社的组织和营销》序
·中国图书如何走向世界
·社会热点问题选题策划
·什么是审读
·编辑学研究深化的可喜成果
·利用计算机编制字典页码的一次尝试
·令人瞩目的《中国蒙古学文库》
·试论编辑价值观
·讲述展现人性至善与生命壮美的故事
·亟须加强农村读物的出版和发行
·全国第三届出版科研优秀论文奖评奖揭晓
·1937~1949年的香港出版业(下)
·韩国学者闵丙德先生
·也 谈 审 读
·面对21世纪 我们瞄准哪里
·能动性和受动性相统一是编辑活动的普遍规律

 

利用计算机编制字典页码的一次尝试

蔡夏初

    做辞书编辑的人都有一个烦恼,那就是填写检字表、索引以及参见条的页码。因为一本字词典的收字收词动辄成千上万,要是书中还设立了参见条,填页码简直就成了一种苦役。虽然有时候可以将它推给校对人员,那也不过是以邻为壑。而且即使反复核实,也难免有漏网之鱼,极易造成硬伤。正因为如此,在国内出版的字词典中,为了方便读者查检,虽然一般也设立了参见条,但是给参见条加上页码的却已经不多见了。然而利用计算机进行处理,页码的填写工作却可以做得比较轻松。我在为《小学生字典》填写页码时,就尝到了这一甜头。
    要进行上述工作,必须具备下列条件:
    1. “黑马编校98”(或者“黑马编校2000”)和微软公司的“Office97”。
    2. 一个通过了北大方正二扫的大样文件(S2文件或者PS2文件),该大样文件的内容必须 与经过三校付型待出胶片的最后清样相符。
    一、 利用“黑马编校98”将大样文件转换成文本文件
    “黑马编校98”是一个以校对为主的软件,但它所附的“S2文件转换成txt”的功能却是个 不错的玩意儿,借助这一功能,就可以利用一个大样文件,轻松获取一个与正文一字不差的 纯文本(当然是理论上的)。我们这里也要借助于这一软件的这一功能。
    首先运行“黑马编校98”,点“文件”菜单中的“打开”选项,选中所需打开的大样文件, 待上一会儿,一个文本文件就已经生成。不过,当程序弹出一个对话框,要你键入初始页码时,你必须键入一个数字。通常都是键入“1”,这样,黑马就会在每页的最后一字后自动 加上一个页码,此页码与成品书中的页码完全对应。不过在本次操作中,最好是键入“2” ,这是为了在Excel中能顺利地利用其向下填充的功能填充数据。
    二、 利用Word97中的”宏”,处理由大样文件转化生成的文本文件
    选取制作页码检字表所需的全部文本Word97中的”宏”十分有用,它可以将你的每一步操作记录下来,这个所谓的“宏”其实就 是一小段程序。当你运行该“宏”时,它将再次运行已记录的操作。如果能巧妙地加以运用 ,可以减少许多重复的工作。另外在Word中微软公司还嵌入了Visual Basic for Applications(简称VBA),如果我们运用得法,将赋予机械操作一定的智能性,有时候甚至可以使你 的工作如虎添翼,事半功倍。我在给《小学生字典》添加页码时,就利用了这一功能。
    选取制作页码检字表所需的全部文本,是制作页码列表的关键。《小学生字典》需要填页码 的主要有这么几项,一是字头音序检字表,一是字头的部首检字表,一是正文中的参见条。正文中的参见条又分为多音字的“见××页”和连绵词的“见××页‘某’字条”。要编制 部首检字表的页码需要“部首”、“笔画数”、“字头”和“页码”这四项,正文中的参见条需要“见××页”和“见××页‘某’字条”,字头音序检字表则可直接在制作部首检字表时获得。知道了自己的需要,下一步就是为此设法。
    具体操作是点击“工具”菜单中的“宏”,再点弹出菜单中的“宏”,或者按“Alt+F8”, 调出“宏”对话框。在“宏名”框中键入一个自己愿意使用的名称,再点击“创建”,"Visual Basic编辑器”随之打开,再编写代码。
    编制页码列表需要有字头和字头在书中的页码两部分,选取页码好办,由黑马软件生成的文本文件中页码的左右都加了数量不等的“=”,我们就利用这一特征先选取这一部分。将其标示为红色或者其他非黑色的醒目颜色。我们知道Word97有着强大的查找替换功能,其“查找和替换”对话框中有一个“高级”选项,其中的“特殊字符”中列有“任意字符”——“ ^?”,当你在查找内容中使用了这一特殊字符,它将适用于不同ASII码的字符,只要是一个单独的字符。因此当 .text = ″==^?.==″,即查找内容为″==^?==″,我们就可以找到小于10 的任一页码,当查找内容为″==^?^?==″,我们就可以找到小于100的任一页码,当查找内容 为″==^?^?^?==″ ,我们就可以找到小于1 000的任一页码。首先在“宏”代码中设定两个变量,一个是代表运行次数的I,一个是代表任意字符的j。将查找内容设为等于 ″==.″+ j + ″.==″,即 .text = ″==″+ j +″.==″,利用循环语句将所有找到的内容标红。当一次循环 结束后,程序自动将运行次数在原有的基础上加1,将代表任意字符的j在原有基础上增加一个“^?”,直到程序按照预先设定的条件停止运行。运行这个“宏”,就可以将页码全部标红。
    提取字头的工作相对来说要困难些,但也并非无法可想。我们知道,辞书类读物区别于一般 读物的一个重要特征就是它是按一定的格式编写的,各个条目都遵循相同的体例,使用同一 格式。《小学生字典》基本上也是如此,在字头后紧接着就是部首名、笔画数。如“格”在转换生成的txt文件中表现为“格木部10画”。在这里有两种标示字头的办法,一种 是利用“部”作关键字,其缺点是取值范围过宽,将使一些不需要的内容也被选取,利用“ 画”作关键字,其缺陷同“部”;一是利用“部”和“画”来取值,查找内容为“^?^?部^? 画”或“^?^?部^?^?画”,第一个^?代表字头,另一个是部首名,第三个是笔画数。因为笔 画数大于9而小于100,所以,在“宏”代码中要设置一个变量,使笔画数由一个″^?″变成两 个″^?″,当超出两个″^?″时,“宏”将自动中止。利用循环语句将所有找到的内容标红。这样做,不仅一举获得了“字头”、“部首”和“笔画”这三项,而且基本上不存在其他文字 滥入的可能。然后,再在“查找和替换”对话框中将“查找内容”的“格式”设为字体颜色 自动,将“替换为”设为空,就可以用“替换”命令将其他文字删去。
    这样就得到了一个只包含填页码所需内容的新文档,然后利用Word 97所提供的特殊字符“^ t”(制表符),用替换的办法,在“字头”、“部首”、“笔画”之间加上一个制表符, 再调用“表格”菜单里的“将文字转换成表格”,生成一个部首检字表页码表。运行一个特制的“宏”,将页码抽出列入另一栏,留待Excel中处理。同理,我们也可以做成一个只包 含正文参见内容的表格。
    三、 利用Excel 97在每一个字头后都加上页码,再按照一定的条件,生成所需的页码表
    在Word97中生成的表格还必须调入Excel中进行处理,这主要是借助于Excel 97强大的数据自动填充功能和排序功能,来给每一个字头加上页码和按照给定的条件排序。具体做法是: 将Word 97中生成的表格粘贴到Excel中,将鼠标指向页码的右下角,当光标变成十字时双击 ,所击单元格中的数据将自动向下填充,如此类推,直到将所有的页码都处理完毕。然后, 按照自己的需求进行排序,最终生成自己所需的页码表。至此大功告成。
    在上述的”宏”中,使用了一些VBA编程,它使一些重复性的操作脱离了人工的干预,可以 极大地减轻编辑处理的工作强度,其好处是显而易见的。限于篇幅,未将各“宏”列入。当然,由于《小学生字典》本身的一些特殊性,给电脑的处理提供了某些便利,而这些便利并 非是任意一本辞书所具有的。
    (作者单位:湖北辞书出版社)

 (ID:45)
© 2001-2003 出版科学杂志 版权所有
报刊转载必须征得同意并支付稿酬,网络转载必须注明作者及本刊网址
武汉大学信息管理学院4楼403室 邮政编码430072 电 话:027 68753799 传 真: 68753799 E-mail: cbkx@163.com

技术支持:cgz@163.com
【您是第位访客】