电子编辑和电子出版物:概念、起源和早期发展(中)林穗芳
(3) 后处理 每种书完成二校后进入后处理(post-processing)阶段,全书校样被制成压缩文件,下载到后处理页。负责后处理者有责任消除二校可能遗留的差错,把由许多人分头校对的全书校样整合成一份体例一致、前后连贯的大文件,即整理成符合 PG质量要求、可以发布和存入PG书库的电子书。 后处理工作可以由项目经理自己做,也可以由别的志愿者做。后处理者(post-p rocessors)据称是“文本的最终的编辑者”(the final editors of the text ),要求他们具有比普通校对更多的经验,对校对工作准则十分熟悉。 后处理检查(PPV)是后处理的第二道工序,由熟练的后处理者负责,检查经过后处理的电子文本可能存在的大大小小的差错,提出修正意见。能胜任这项工作的后处理者不多,一个志愿者必须了解电子文本带普遍性的问题、所提交的多种电子文本被证明质量一贯良好才会被委以后处理检查的重任。 (4)发布 发布(posting,也译“发贴”)是电子书生产过程的最后阶段。电子文本完成编校和后处理工作后原来由哈特个人终审后发布,在每月发布的种数激增后在2001 年9月成立了一个发布组(Posting Team)负责这项工作。其任务是检查版权问题是否已经解决,文字质量和技术规格是否符合要求,格式是否需要转换和增加,然后给文本编号,送入FTP(文本传输协议)服务器供发行。 发布是防止差错的最后一道关口,担负这项任务的是工作最认真细致的志愿者。发布组检查的范围从简单的拼写是否正确到所用的XML格式是否有效等等,凡是容易出错的环节无所不包。如果是纯文本,使用通用校对软件“spellcheck”和PG 文字规格专用软件“gutcheck”(“谷检”)迅速清扫一遍。“gutcheck”检查通用校对软件不检查的问题,主要检查体例规格是否符合PG的规定。如果制作者在某些地方有意使用不同于PG电子书的特殊格式,要求在稿中附加说明以便编辑注意审查是否可行。完全齐清定、各个方面都无问题的电子书通过标准检查程序至少需要15分钟,存在少量问题须帮助解决的需要费几个小时,平均1个小时。存在大量差错的则退改。发布组收到送来发布的电子书三四天内给予答复:已发,或提出修改意见。 电子书发布时在书名前加上“The Project Gutenberg Etext”(谷登堡计划电子文本)或“The Project Gutenberg Ebook”(谷登堡计划电子书)字样,使读者一开始就知道这是PG版电子书。其他单位转载时也要求加上这样的识别标志。据说“etext”(电子文本)一词为哈特创造的,PG早期的电子书用“Etext”的名称编号;80年代以后,“ebook”(电子书)一词逐渐流行,也用“Ebook”的名称编号。 PG电子书在正式出版前一个月先出试用本,征求意见,以便改正差错,编得更好。英国儿童文学作家刘易斯·卡罗尔的《爱丽丝漫游奇境记》在1991年1月1日首发,现在已出至第30版,最近一次更新日期为2004年1月10日。内容更新只是改正小差错,不改变版次。《论语》中英对照本于2001年11月25日首发,编号为[Et ext #4094],2003年5月出第10版,最近一次更新日期为2004年8月27日。英译用 19世纪英国汉学家理雅各(James Legge)的译文。繁体中文除用Big-5码外,还用中国内地和港澳台WIN2000用户都能读取的Unicode UTF-8码,编码在逐步升级。 PG电子书的质量要求在首发时正确率至少为99.90%,争取达到99.99%;在广大读者实际看到时通常已提高到99.95%,这是包括美国国会图书馆、英国不列颠图书馆在内的许多国家图书馆的电子文本所采纳的标准。据称,PG电子书的大多数的质量高于全世界商业性出版企业出的电子书。在正确率达到99.95%以后,差错率再降低0.02%所需的工作量相当于编辑制作一本新的电子书。校正差错是永远说不完的故事,PG的目标是通过不断修正再版,在不久的将来使差错趋于零。电子书发布后被压缩成一个大文件上传谷登堡计划文献典藏基金会网站(pglaf. org)转存于两个服务器——ftp.ibiblio.org(在北卡罗来纳州,也起总部服务器的作用)和ftp.archive.org(在加州)。宣告新书发布的手段是以电子邮件把新书目录增添进PG总书目索引《GUTINDEX.ALL》,PG志愿者、读者和提供链接PG电子书服务的其他网站通过这个总书目索引可以了解新书发布情况,从上述两个服务器下载所需文件。PG网站数据库每天自动生成新书索引条目,内容包括书名、副书名、电子文本编号、语种、字符集编码类型。PG索引编制者可在这个基础上增加一些可供检索的项目,如作者生卒时间、美国国会图书馆分类号等。 电子书发布后有专人维护,包括修补缺失、改正差错、重新格式化使符合PG现行标准。有些旧文件升级为HTML文件后重新编号发布,旧文件仍保存,可以查阅。 HTML文件,特别是带插图的HTML文件,现在无须下载,在网上就可直接看到。(5)发行 PG的使命可简单概括为一句话:“鼓励创制和发行电子书”。它的一种重要发行方式是在全球建立尽可能多的镜像站点(mirror site),这样可以分担需求量较大的电子书的发行负担,确保用户能就近迅速下载,就近下载的文件通常比远程传送的更清晰。多处存放比集中存放好,一处文件被损毁或消失,从他处仍可以得到。现有的FTP站点和万维网站点,其文档服务器有多余的空间,把PG文档服务器的部分文件或整套文件加以复制存储以备公众使用,便成为PG的镜像站点。据说PG总部直接监控的一个镜像站点每月被下载的电子书高达100万种次。为庆祝第10000种电子书的出版,谷登堡计划创始人哈特和谷登堡计划文献典藏基金会首席执行官格雷戈里·纽比(Gregory Newby)2003年12月10日在旧金山金门俱乐部举行招待会报告工作,向各个与会者赠送了载有精选PG电子书近3500种的 CD和载有PG电子书近万种的DVD光盘各一张。此后,PG定期制作ISO files格式的图像文件供读者下载,用以制作CD光盘或DVD光盘。访问谷登堡计划DVD下载网站(DVD download directory on gutenberg.org.)可把万种PG电子书下载于1张D VD。要是读者家中没有DVD刻录软件或嫌下载时间太长,无论在世界任何国家都可发电子邮件到PG基金会光盘处(cd @pglaf.org)请求免费邮寄录制好的盘片。该处由志愿者在家中刻录好用普通包裹按所指定的地址寄去。条件许可时寄赠两张,一张留下自用,另一张可以送人,欢迎在当地用DVD刻录机再复制赠送朋友、学校或图书馆。作为补偿,受赠人或受赠单位可向基金会捐赠接纳处(http://www .gutenberg.org/donate)捐点钱,1—5000美元的小额捐款对谷登堡计划都是至关重要的。哈特称:“我们的‘无限发行模式’要求做到每个人都拥有把1万种电子书存储在1张只值1美元的DVD光盘上的图书馆”[36]。这种图书馆是可以随身携带的,1万种电子书录载在标准的可录写DVD光盘上,重量不到1盎司,DVD双面或双层盘1张可容纳电子书2.5万种,新出的DVD盘片1公斤可容纳电子书100万种。 2004年6月国内出版文渊阁本《四库全书》线装本,限印300套,定价1套39万元人民币,这是一种限量发行的模式。像《四库全书》电子版只用一张DVD光盘就能全部容纳,如果以人民币10元的成本价无限量发行,便可真正进入寻常百姓家。据称直到1988年即谷登堡计划在网上推出的电子书超过1000种之时,世人开始认识到哈特率先在网上建立一个数字图书馆,但从上述情况可以看出,仅把谷登堡计划网站看作互联网上第一个数字图书馆是低估了它的历史意义,它同时也是在互联网上最早建立的编辑出版发行机构。哈特在网络环境下创造了一种全新的知识产品传播模式:把编辑、出版、发行机构和图书馆融为一体,全球的志愿者都可以参与它的工作,它的数字化知识产品全部免费向世界各国读者提供,这是电子书籍编辑、出版、发行一体化和全球化的新模式,向国际出版界提供了一个从 “有限发行”(limited distribution)转向“无限发行”(unlimited distri bution)的范例。与传统图书馆限量限时向读者出借藏书不同,谷登堡计划把整个图书馆全部藏书的软复制件都免费提供读者永久使用。公益性的文化出版事业依靠和推广这种工作模式,将使人类一切有价值的文化知识遗产永远得以流传,为世世代代的读者共享,再也不会因出版商无利可图而绝版导致最后湮灭。参考文献 [18] Baker D B. World’s First Electronically (Computer) Published S cientific Journal[A]. In:Pioneers’ Reminiscences[C]. Columbus(OH ): Business First of Columbus Inc.,1988. 253. , accessed 2004-08-04 [19]Williams R V. Chronology of Information Science and Technology[ EB/OL]. Revised Spring, 2002., accessed 2004-09-12 [20]Garson L R. Communicating Original Research in Chemistry and Rel ated Sciences[A]. In: Accounts of Chemical Research[C], 2004, 37(3 ): 141 [21]Brief History of Electronic Publishing 8/2000[EB/OL]. , accessed 2004-09-12 [22]Garfield E. Chemical Information as a Commercial Marketplace[A] . In:Collier, H R., ed. Proceedings of the Montreux 1989 Internationa l Chemical Information Conference[C]. Montreux(Switzerland): Infonor tics Ltd., 1989. 1-11 [23] Luhn, H P. A Business Intelligence System[J]. IBM Journal of Research and Development, 1958, 2( 2):159-165 [24] Hugo J, Newell L. New Horizons in Adult Education: The First F ive Years (1987-1991). The Public-Access Computer Systems Review: 1991 , 2 (1), 77-90 [25] Open eBook Forum. A Framework for the Epublishing Ecology. Vers ion 0.78( 2000-09-25)[EB/OL]. ,accessed 2004-08-04 [26] Bush V. As We May Think[A]. The Atlantic Monthly. July 1945: 101-108 [27] Zachary G P. The Endless Frontier, a Biography of Vannevar Bush [EB/OL].,accessed 2004-09-12 [28] Nelson T H. Complex Information Processing:A File Structure for the Complex, the Changing and the Indeterminate[A].In:Proceedings o f the ACM 20th National Conference 1965[C]. New York: ACM Press, 196 5, 84-100 [29] Expert Declaration of Andries van Dam. Executed on 2001-02-26 [ EB/OL]. < http://www.rosettabooks.com/casedocs/RH_Van_Dam.pdf>, acces sed 2004-08-04 [30] Kay A, Goldberg A. Personal Dynamic Media[J]. Computer, 1977, 10 (3): 31-41 [31] Williams R V,Bowden M E. Chronology of Chemical Information Sc ience [EB/OL]. Last updated 1999-08-11. < http://www.libsci.sc.edu/b ob/chemnet/DATE.hmtl>, accessed 2004-09-12 [32]Hein K K. Introduction to Information Technology [EB/OL]. < h ttp://www.missouri.edu/~heink/7301-fs2004/ebooks/ebkhistory.html>, acc essed 2004-09-12 [33]Joyce M. Afternoon, a Story. Hypertext edition ed[M]. Cambridg e(MA): Eastgate Systems Inc., 1987 [34]Ditlea S. The Real E-Books [EB/OL].< http://www.techreview.com / articles/july00/ ditlea.html >, accessed 2004-09-12 [35]Vaknin S. Interview with Michael Hart. 2002-05-27 [EB/OL]. , last updated 2002-10-18 [36] Vaknin S. Project Gutenberg’Anabasis [EB/OL]. ,posted 2004-03-24 (作者单位:人民出版社) (ID:770)
|