本站自2005年开始,过刊仍然提供下载,新刊在半年内将不提供下载, 欢迎订阅
   Publishing Science    首页
湖北编辑学会主办  
 
2005年第四期  
 
目 录

卷首语
·出版业要正确处理改革、发展和稳定的关系 / 宗 诚
专论·特约稿
·出版社转制问题的观察与思考 / 宋木文
编辑学·编辑工作
·电子编辑和电子出版物:概念、起源和早期发展(中) / 林穗芳
·试论编辑发现及其基本特征 / 江 凌
·编辑主体价值的构成与实现 / 李统兴
出版学·出版工作
·出版改革与路径依赖 / 高诚毅
·试论校对心理 / 周 奇
·论新形势下出版业的政府保护 / 胡 潜
·对我国报刊发展、治理的思考 / 龚维忠
·出版职业道德的自律与他律 / 龚绍石
数字技术·多媒体·网络出版
·网络即时通在编辑工作中的应用 / 王栾生
·对网络游戏造就“新生代容器人”现象的思考 / 张 薇 孙园园 方新定
书苑掇英
·版权保护与版权产业的发展 / 杨可知
·提高出版竞争力关键在人 / 徐江涛
·Word中符号工具栏的灵活设置 / 杨朝晖 顾素萍
·认真做好图书版本记录 / 朱有茹
·高校教材用户服务质量管理 / 蔡宏志
编辑史·出版史
·为毛泽东印制大字线装书 / 方厚枢
·李达的编辑活动与马克思主义在中国的传播 / 段乐川
·自将磨洗认前朝 / 吴 楣
编者·作者·读者
·自律:重建专业化 / 汪家熔
·伪书畅销成因和伪书现象思考 / 杨 锋
·伪书现象及对策选择 / 史玉娜
品书录
·《出版物市场管理概论》读后 / 老 鸣

 

电子编辑和电子出版物:概念、起源和早期发展(中)

林穗芳
第5页 共6页 >> 1页 2页 3页 4页 5页 6页

  多数电子书具有全文检索和超文本链接功能。为了显示特色和保护版权,不同厂商开发的电子书采用自己设计的格式和自己独有加密方式,各种阅读器因内码不统一而不能兼容(如采用“软书”格式的电子文本,不能下载于“火箭电子书” 阅读器)。据史蒂夫·迪特利亚的统计,专用电子书阅读器到2000年夏季已达2万种左右[34]。专用电子书阅读器不能互通,用途单一,销路反而不如兼备阅读电子书功能、具有多种用途的掌上电脑和PDA。电子期刊出版业早已联合开发出共同的标准。美国商业部国家标准与技术研究所(NIST)在1998年底组建了开放性电子书标准委员会(OEBSC),吸收美国出版商协会、微软公司、兰登书屋、各大电子书阅读器开发商参加,提出基于HTML和XML、便于读者使用的标准草案,试图解决各种格式互不兼容的问题,为电子书进一步发展扫除障碍。第一步工作成果是制定《开放性电子书出版结构》(Open Ebook Publication Structure),对数字化图书格式如何兼容和标准化作出规定,1.0版于1999年9月公布;2002年2月又发布了1.2版,增添了数字化作品版权保护的内容。电子书标准总是要吸收先进的科技成就不断改进的。目前多数读者仍然是通过个人计算机来浏览电子书。电子书标准制订主导权的争夺战主要在Adobe和微软两大软件公司之间展开。它们免费推出和随后不断升级的电子书阅读软件和版权保护软件各有所长。Adobe电子书阅读软件是以已趋成熟的PDF(可移植文档格式)为基础的(其7.0版支持简体和繁体中文),可下载到各种台式机、笔记本计算机、掌上电脑及专用的电子书阅读器上,被下载到个人计算机的数量已超过1亿,采用PDF格式的电子书如果出版商允许可以照原样打印出来,因此在让电子文件跨平台被浏览与打印的实力上,Ad obe阅读软件目前较微软阅读软件略胜一筹。
  5.5  谷登堡计划:电子书籍编辑出版发行全球化和一体化的新模式
  通过计算机网络向公众免费提供电子书籍的计划是1971年从美国伊利诺伊大学开始的。该校大学生迈克尔·哈特(Michael Hart )因为帮助学校计算机中心设在资料研究实验室的施乐Sigma V主机的操作员作了许多工作,成为他们的好朋友,被赠与上机时间价值一亿美元的账号,可以用来做任何事情。他认为计算机所能创造的最大价值不在于纯数字计算,而在于存储、检索、查找图书馆藏书,任何作品一旦进入计算机便可从有限量复制变为无限量复制。他开始考虑如何把世界各国已进入公共领域(即无版权或版权超过保护期)的古典作品及其他有重要历史意义的文献由印刷本变成电子文本在网上传播,把传统的图书馆搬到网上,使世界任何地方的终端用户都可以自由读取或下载。哈特可以利用的这台主机是互联网的前身阿帕网的15个节点之一,当时的一般计算机存储量不大,于是他在19 71年7月选择篇幅小、只有5K的《美国独立宣言》据羊皮纸复制本逐字键入,储备在电子邮件指令集内,在网上发布通告欢迎下载。哈特以欧洲活字印刷术发明人谷登堡的名字为他的传播人类精神财富的计划命名,称为“谷登堡计划”(Proj ect Gutenberg,简称PG,也可以译“谷登堡工程”)。哈特接受合众国际社记者萨姆·克宁(Sam Vaknin)采访时表示:“1500—1550年用谷登堡印刷术印行的书籍超过以前历史上出的书籍的总和,我希望电子书也能这样”[35]。 90年代中期哈特在伊利诺伊州本尼迪克坦学院任电子文本教授,PG总部随着从伊利诺伊大学转移到这里。本尼迪克坦学院现为本尼迪克坦大学(Benedictine Un iversity)。2000年谷登堡计划机构正式成为法人。谷登堡计划是依靠志愿者支持和读者捐赠维持的,谷登堡计划文献典藏基金会(PGLAF)已作为慈善组织在联邦政府注册登记,可以接受捐赠,包括硬件、软件和捐款。谷登堡计划的正式网站名称原为“http://promo.net/pg/”,现为“http://www.gutenberg.net”。哈特是谷登堡计划执行主任,负责整个计划执行的协调工作。
  由于受技术条件和个人力量的限制,1971—1979年只完成9种,平均每年1种。继《独立宣言》之后是《人权法案》和《美国宪法》等,第9种为1979年12月1日发布的《阿伯拉罕·林肯总统第一次就职演说》,都是篇幅不长的历史文献。在80 年代与志愿者合作用扫描代替打字把整部《国王詹姆斯钦定本〈圣经〉》录入计算机,于1989年8月1日推出,用了近20年时间才出10种,起初有人以为难以为继。哈特坚毅不懈的努力,赢得了越来越多的志愿者支持。随着实施计划的组织系统的建立和发展,信息技术的进步(如可以用扫描软件扫描代替打字把文件录入计算机,80年代使用个人计算机可以在家里工作),编校规章制度的完善,出版进度逐步加速。1991年平均每月1种,这是第一次飞跃的发展,此后几乎是年年成倍增长。1992年每月2种。1993年每月4种,年底出到第100种,为《莎士比亚全集》。1994年每月8种,1995年每月16种,1996年和1997年每月32种,1997年底出到第1000种,为但丁《神曲》意文本。1998年和1999年每月36种,1999年底出到第 2000种,为塞万提斯《唐吉诃德》西文本。2000年每月36种。2001年上半年每月 40种,下半年每月50种。2002年每月200种。2002年4月出到第5000种,为《达· 芬奇笔记》英文本。2003年10月15日出第10000种,为英国1215年《大宪章》。出第一个5000种用了30年,出第二个5000种不到30个月,从1994年到2003年10年间出版种数增长约10倍。至2005年1月5日出版第14599种,2004年全年出版近4000种,平均每月约330种。萨姆·克宁报道,哈特雄心勃勃,要争取在2015年使免费电子书突破百万种大关,在达到这一目标以后的第二个重大步骤是把其中的每一种翻译成多达100种文字,使它们能为更多的读者利用。
  PG所出电子书以英语的为主,其他语种的逐渐增多。2004年的PG在线书目上列有 36 个大小语种的电子书可供检索,其中包括中国古籍几十种。出版较早的有《孙子兵法》英译本(译者为大英博物馆汉学家Lionel Giles,1910年初版),有长篇序言和评注,1994年5月1日上网,编号为[Etext #132];中文版于2004年5月 22日首发,编号为[Ebook #12407],用Big-5码。与《孙子兵法》中文本于同日首发的还有《周髀算经》中文本,编号为[Ebook #12408],可供下载的有Big- 5码的纯文本和 HTML文本、ISO 8859-1码纯文本。新出的中文本书名加带声调符号的汉语拼音。作为一种宣传推广手段,PG网站每天公布被下载次数最多的前10 0种电子书排名榜,《孙子兵法》2004年9月3日至11月15日被下载11809次,排名第三。
  谷登堡计划的电子书使用多种格式,以纯7位ASCII文本(txt files)及其压缩文本 (zip files)为首选的和最基本的格式,目的是使所出的电子书能为最广大的计算机用户完整地读取。“纯”是强调文本中只使用ASCII(美国信息交换标准码)字符集中的字符,不夹用其他编码字符。这套标准码是国际通用的,共有128个字符,包括大小写拉丁字母、阿拉伯数字、一些标点符号和#、&、$、@等常用特殊符号。这些字符一般英文键盘以及世界上几乎任何类型计算机的键盘上都有,用 ASCII字符写成的纯文本任何电邮都能全部传送,计算机屏幕和网页都能清楚地显示,不会出现乱码。但ASCII字符集没有加符字母,主要适用于英文。如果文本有加符拉丁字母或希腊字母等,则须用8位的扩展字符集,如ISO 8859系列的国际标准之一种。8位的扩展字符集在ASCII字符集的基础上把字符数扩展到256个,增加了128个。法文、德文、西班牙文、荷兰文等使用加符拉丁字母,适用ISO 8859- 1(又称Latin-1)。希腊文用 ISO 8859-7。西方的拼音文字总的说来字符数少,使用一个字节存储一个字符的单字节字符集;中文的字符数量多,则要使用多字节字符集。
  PG电子书的编辑、出版、入藏和发行的工作程序经历一个摸索前进、逐步完善的过程,下面介绍现行的基本程序,但不是一成不变的。
  (1)选书和制作电子文本
  任何人愿意为谷登堡计划做工作便是志愿者,无须办理申请登记和审批手续。选书和制作电子文本的人又称“内容提供者”。PG总部没有入选图书总目可供志愿者选择,由志愿者根据个人的爱好和判断选择有传世价值的书出电子版。选题范围主要是1923年以前出版的书,这些书在美国已超过版权保护期,进入了公用领域。报刊在1923年以前发表的文章也可选,但不能太短,短文可编成专题文选。选书时要上网查一查是否已有在线版。据说PG依据的底本99%以上都有差错,因此过去出版的书凡是有多种版本的都要参考利用,不以一种为准。书选定后把印刷本的扉页和版权页(版本记录页)扫描一份发到总部网站版权处或把照片邮寄总部版权工作负责人,审核版权确实无问题后存档备查。志愿者要得到核准(表示OK)的正式答复后,方可开始制作。事实上,志愿者提出制作自己挑选的电子书的请求,99%都得到批准,志愿者愿意制作任何语种的一种或多种格式的电子书,PG都乐于接受。在版权保护期限内的书籍如果得到版权持有人授权也接受出版,这类书籍只占一小部分。
  原著内容录入计算机,可以采用打字、扫描、口述或其他任何一种方法。如果原著字迹已模糊不清,必须打字录入;一般的书也是打字录入的效果最好,但速度较慢。现在多用扫描的办法,较新式的扫描仪1小时可扫描200页。选定的书逐页以图像格式扫描进计算机,转换成一幅幅位图图像,再用OCR(光学字符识别)软件对该位图进行分析,将字符形状加以区分和识别,转换成可以在字处理器中进加工的文本文件,再用人工进行查错和更正。文本文件的分行要同图像文件保持一致,把图像文件和文本文件两种文件同时发送到PG校对网站等待校对和加工。制作者也可以自己进行初步的校对和加工,然后再发去。要是制作者没有OCR软件,只给网站发送图像文件也是可以的。原著包含大量加符字母而去掉附加符号会降低质量时,要求制作者至少提供一种能保存原著全部内容的电子稿(比如用IS O-8859系列的国际标准或Unicode统一码制作的文本文件),最好再加一种去掉字母附加符号的纯ASCII文件。
  (2)校对
  为谷登堡计划服务的“校对分配网”(http://www.pgdp.net)成立于2000年,校对世界各种文字的电子书,英文书占的比重最大。此外,在2004年1月还成立了“ 欧洲校对分配网”(http://dp.rastko.net),该网站有能力处理多字节的Unic ode UTF-8码,也校对英文书,但工作重点是西欧和东欧其他文字的电子书。PG志愿者大多数先到校对网站登记,提供自己的电邮地址,获得一个用户密码,据以进入网站查阅内部文件和进入个人网页。志愿者查看网站的“工作进度表”(In -Progress List),根据自己的爱好和专长选择一种电子书试校几页(2004年11 月25日等待初校的英文书有885种、非英文书176种),熟悉工作程序,看自己是否有兴趣继续进行下去。工作量可多可少,完全由自己决定,是十分灵活的。网站任务在名义上是分配校对工作,实际上要做大量的编辑加工工作,只是在工作程序上先校对,使电子文本内容符合原著,在这个基础再进行编辑加工,或边校对边加工,校和编往往是合一的。
  电子书稿采用多人(可能多达几十人)分头校对的办法。通常的做法是一个志愿者一次校一页。网站通过一个特定的网页发送一页原著的图像文件和OCR软件产生的文本文件供志愿者对照比较,找出两者差异,改正OCR软件在转换过程中产生的差错,使文本文件符合图像文件,并依照校对工作细则的规定标出文本中的黑体字、斜体字和脚注等。做完一页存入自己的文档,并通过同一网页发回网站,或者要求再校一页或者当天到此为止。同一天还有其他志愿者在校对同一本书的其他页和其他书。经过初校的校样存储在PG数据库随即安排二校。一本书至少校两遍,二校由具备一定校对经验的志愿者进行。一本中等篇幅的书初校几个小时,二校要5—30小时,以10—15小时为常见。因为校对人员数以百计、千计,加起来一天能校不少书。据2004年11月25日公布的数字,校对分配网用户总数为28534人。2004年全球各地的志愿者平均每天有300—400人参加校对,一天可完成4000— 7000页。
  校对网站设项目经理,一种书立项后被列入项目经理的网页。项目经理负责该书内容的上载、校对任务的分配、回答校对问题、全书的后处理和各个工作环节的协调事宜。  (ID:770)
第5页 共6页 >> 1页 2页 3页 4页 5页 6页
© 2001-2003 出版科学杂志 版权所有
报刊转载必须征得同意并支付稿酬,网络转载必须注明作者及本刊网址
武汉大学信息管理学院4楼403室 邮政编码430072 电 话:027 68753799 传 真: 68753799 E-mail: cbkx@163.com

技术支持:cgz@163.com
【您是第位访客】