电子编辑和电子出版物:概念、起源和早期发展(中)林穗芳
编者按:本文共7节,分三部分发表,本刊上期刊发了第一部分(有关电子编辑和电子出版的概念、类型和起源的第1—3节),本期刊发第二部分(第4—5节),下期将刊发第三部分 (有关电子报纸和中国早期电子出版物的第6—7节)。 4 世界最早的电子出版物《化学题录》和早期的电子期刊 《化学文摘》在1907 年创刊时一年刊发文章7994篇,1960年一年刊发的文章已达 104484篇。在50年代末发表的大量化学论文往往要超过一年甚至更长的时间才能以摘要的形式出现在《化学文摘》的主题索引中,这种迟后状态是化学家难以接受的。据化学文摘社社长戴尔·贝克(Dale B. Baker)在《世界上第一种以电子技术(计算机)出版的科学期刊》[18]一文中回忆,1959年4月,时任IBM公司系统开发部主任的汉斯·彼得·卢恩在新泽西州大西洋城美国化学学会文献部的一次会议上作了关于题内关键词软件开发和机编索引技术的报告后,应邀访问化学文摘社(社址在俄亥俄州哥伦布市)同贝克和应聘来社担任领导职务的英国化学家乔治·戴森会晤。考虑到《化学文摘》的用户一直在呼吁提供迅速的有关世界最重要的化学研究成果的信息服务,他们商定立即进行题内关键词技术试验,出版一种以提供近期发表的化学文献篇名和检索途径为主的新型期刊——《化学题录》(Chemical Titles),贝克称之为“新概念期刊”(new concept periodi cal)。该社建立小规模实验性工厂、进行市场调查研究和出版试刊所需资助11. 2万美元的申请,立即得到美国国家科学基金会的批准。据他说,《化学题录》在 1959—1960年用电子计算机出了几期试刊(test issues)征求意见,全都受到读者欢迎。《化学题录》从1961年1月起正式出版,为双周刊,1年24期,订阅费1年 30美元。《化学题录》同时出磁带版和印刷版,单位和科学家个人均可订阅。当年提供68400篇文章的题录,平均每期约载3000篇,选自世界各国550种理论化学、应用化学和化学工程方面的期刊(20世纪末21世纪初《化学题录》选录的期刊增至近千种)。它是在《化学文摘》出版之前使读者及时了解化学各领域科研最新进展情况的快报型检索工具。自收到现刊从中选择文章到《化学题录》出版不超过 21天。 《化学题录》几期试刊出版时间在1959—1960年是据贝克本人的回忆:头两期是在1959年出版的,但有关资料大都说,几期试刊均在1960年出版,美国和世界各大图书馆入藏的《化学题录》编号多是从1960年或1961年起,没有查到从1959年起的。例如南卡罗来纳州大学图书馆与信息科学学院罗伯特·威廉斯教授编的《信息科学技术大事年表》(2002年修订)[19]说,1960年化学文摘社出了《化学题录》最初5期样刊为月刊,于1961年开始出双周刊。美国化学学会出版部洛林 ·加森(Lorrin R. Garson)在2004年3月发表的《传播化学及相关科学领域原创性研究成果》一文中确认:“早在1960年,化学文摘社就出版了《化学题录》几期样刊,随后在1961年以磁带的形式出版双周刊”[20]。芬兰联合版权组织( Kopiosto)网站2002年8月登载的《电子出版简史》(Brief History of Elect ronic Publishing)曾报道:“电子出版的发展,始于计算机开始用来生产出版物。起初是借助计算机生产科学出版物的摘要和索引。这些出版物印刷版和磁带版同时供应。第一种是1961年出版的《化学题录》”[21]。 智能分析不可能完全实现机械化。准备选入《化学题录》的每一篇文献的标题及有关材料事先须经一定的人工编辑(例如为了保持用语的一致,事先把自然语言的化学名称改成化学文摘索引中的表现形式),使适合于键控穿孔机操作员在卡片上给文件穿孔,把它转换成机读形式,然后把记录在每张穿孔卡片上的信息依次读入主磁带,由一台IBM 704型计算机按照预定的程序进行自动化的编辑加工,在约12分钟内即可完成。处理的结果依顺序转录到另一卷磁带上,由操作员取下,送入辅助设备一一打印出来。主磁带可以长期保存,复制新磁带,也可以根据需要再加工,对内容增删或修改。《化学题录》的内容分为三部分。 (1)题内关键词索引(KWIC Index):题内关键词也称上下文关键词,依靠上下文来确定词义。关键词指文献标题内有实质性意义、用来检索主题内容的词,不包括预设的“非用词表”(stoplist)中的词,如冠词、介词、连词、助动词等虚词以及“研究”“分析”“效果”“报告”“理论”“问题”等无检索价值的实词。非用词表置于主存储器内,题内有非用词计算机编制索引时会自动排除。每条索引占一行,按关键词的字顺排列。文献标题中的关键词和非关键词都保留,关键词排在索引行的中部位置——中栏各行的开头,关键词前后的标题其余部分则排在关键词两侧。关键词与上文之间的隔空稍大于词与词之间的正常隔空(一般占1个字符的位置),在每一索引行中都固定地处于中栏各行的开头,排列整齐,一目了然,便于检索。一篇文章的标题可能包含几个关键词(平均每篇5.3个),每一个关键词都有一次机会轮排到这个作为检索词的固定位置。标题起初最多排60个字符,后来最多可排68个字符(一个间空也算一个字符,1962年以后IB M计算机可处理的印刷字符增至120个,包括大小写字母,在这以前数据库记录只能用大写字母),排不下的部分截去。如果标题尾部在关键词右侧排不下,而左侧尚有空位,即将尾部排到左侧(行首),反之亦然。索引行的末尾排文献出处,由16个字符组成,包括期刊代号、卷期号和文献所在期刊的起始页码。(2)文献题录(Bibliography),按期刊代号顺序排列,包含:1)期刊代号、缩写刊名、卷期号、出版年份;2)作者姓名;3)文献标题全名;4)文献所在期刊的起止页码。 (3)作者索引(Author Index),按作者姓名字母顺序排列,作者姓名后为期刊代码、卷期号和文献所在期刊的起止页码。 关键词索引的著录内容和编排方法现以中教育星软件股份有限公司《化学文献及查阅方法》2001年第2版第3章《题录索引》提供的1980年代初的1期《化学题录》关键词索引版面样式加以说明。 ①标示关键词及上下文。位于中栏以“iso…”和 “Iso…”(词根iso意为“等 ”“同”)开头的词为关键词,首字母小写的“iso…”是题内关键词,首字母大写的“Iso…”是题首关键词。第1行的“isochonic”(等时的)是题内关键词,因被著录的文献标题较短,从“Effect”到“oils”全部排下,末尾用“=”号表示标题完了。第3行的“Isocratic”是题首关键词,排到“chrom”时右侧已无空位,其后续部分“atography of…”转到左侧排,排到 pigments也没有空位了,用“+”号表示后面的字符,即标题末尾部分被截去。第5行的“Isoeletric” 是题首关键词,排到“invertebr”时把标题余下部分“ ate actins.”移到左侧,加“=”号表示标题完了。末行文献标题全文本为“High-moclecular-weig ht carrier ampholytes for isoelectric focusing of peptides”,关键词“ isoelectric”的左侧排了“weight carrier ampholytes for”,右侧排到“pe ptides.”标题结束,用“=”号表示。“=”号的后面尚有空位,再把“weigh t”前面的字符“ar-”排在这里,“ar-”前添“+”号,表示前面的字符被截去。其余各行的关键词及上下文的编排法可类推。②“KTPMAG”等是期刊代号,③ “82-02”等是卷期号,④“040”等是文献所在期刊的起始页码。以期刊代号“ KTPMAG”为线索查Bibliography,便可了解刊名、卷期号、出版年份、作者姓名、文献标题全名、文献所在期刊的起止页码等。 编制文摘要从文章的正文中取词组句,编制题录是从文章的标题中取词截句,自然比编制文摘速度快、成本低。1961年化学文摘社在利用《化学题录》磁带出印刷版的同时,还把题录磁带作为数据库按照卢恩的思路进行以文献标题关键词为基础的“定题信息服务”试验 [22]。 (ID: 770) |