图书搜索成人类知识数字化战争焦点

来源:百度文库 编辑:神马文学网 时间:2024/04/28 22:29:36
21世纪经济报道
本报记者 杨琳桦 上海报道
这是一幕竞争人类数字化知识的战争。
这场新的战争有一个美丽的旗号——跨越语言,跨越时空,将所有书本数字化,重建人类知识的“巴比伦塔”,但只有胜利者才能最大程度享用重建的利益。
8月28日,战争的主角之一Google来到中国。“2006北京国际出版论坛”,Google主管内容合作的全球副总裁昂卫特(David Eun)发表关于“图书搜索”的演讲——这个自2004年年底开始的全球计划,包括Google和图书馆以及出版社的合作。两个月前,“图书搜索”项目刚落地中国。
这样的战争只属于一个注定改变中的时代。互联网构建了人类信息的全球平台,在改变生活尚未数字化的最后角落——阅读,这是影像和音乐之后的最后堡垒。
传统的出版社—图书馆—读者的三角网络,或者说产业链条正在被改写。首先改变的是需求——仅中国,上网阅读率从1999年的3.7%增加到2005年的27.8%,7年间增长了7.5倍。人类阅读习性的变化正在转变为巨大的商业冲动。
一个新的关系网络正在形成——拥有改变能力的是搜索引擎。在无量的信息海洋里,搜索意味着至上的权力。即使人类的语言相隔,通过全球化的网络平台和点石成金的搜索引擎,Google认为自己终可以将信息聚集指尖,让文明在虚拟王国中永生,使人类在同一个地平线相互守望。
“不要忘了Google的欲望。”对于Google的计划,一位分析师的语气尖刻。他认为,不仅内容是搜索引擎公司安身立命并确立垄断性话语权的关键;网上阅览还将为其带来巨额广告;而当“移动阅读”时机成熟,这一商业利润还会扩展到无线领域。
可能的产业垄断者?
《圣经》记载:——创世之初,为窥探天堂奥秘,人类准备建造一座通天的巴比伦塔。但有意制造混乱的上帝赋予各民族不同的语言,使无法协调的人类最终败下阵来。
如今,Google正力图挑起人类重建“巴比伦塔”的冲动。对于Google,“Google Print”是一个什么样的诱惑?
资料显示,——即使在2001年,世界排名前三的出版集团——“Thomson”、“Reed Elsevier”和“WoltersKluwer”,其数字产品收入已分别占公司总收入的53%、27%和27%;以教育业务为主的美国信息服务提供商——麦格劳希尔——和世界第二大期刊出版商——约翰威立——都已提出,在今后5到10年中,人类高教数字化产品比重将大幅增加,而这些将成为它们公司的主要利润来源。
“要做到‘挟天子以令诸侯’,Google依靠的是两个武器。”上述分析师认为,搜索引擎已成为用户网络检索的主要入口,而Google的技术是人类重建“巴比伦塔”的重要阶梯。
在“Google Print”开始不久,Google战略思路逐渐清晰,“Google Print”演变为“学术搜索”(Google Scholar)和“图书搜索”(Google Book Search)等,其中,“图书搜索”又分为“图书馆计划”和“出版社计划”。
率先响应“图书馆计划”的是——哈佛大学、牛津大学、密歇根大学、斯坦福大学和纽约公共图书馆等几家顶级的研究性图书馆。他们对Google奉献不受版权保护(版权在一定年代后已失效)的“公共图书”,并经Google全文扫描后存储于服务器,向用户提供免费“全文浏览”。
“图书馆没有盈利要求,衡量业绩的唯一指标是有多少人阅读。”一位出版业人士认为这是造成图书馆冲动的实质,“他们乐意为人类事业慷慨解囊,但上游的出版社就得为其买单。”
虽然时代已解决语言之困,“巴比伦塔”却同样遭受上帝利益之分的天谴。事实上,因为对出版社的利益迎合——全球平台营销、广告分成以及返还营销效果分析报告,Google“出版社计划”已得到上万家出版社的支持,并在20多个国家以7种语言落地。
但对于“图书馆计划”,出于对Google可能渗透出版业的恐惧,拥有版权并以销售为根本利润点的出版社发起了猛烈抨击。为此,Google先后被美国出版商协会和法国出版集团马帝尼耶起诉。
两者争论的焦点在——由图书馆提供给Google的那部分受版权保护书籍,是否可以存储在Google服务器,向公众提供“全文检索”(在Google开放的数页电子内容中,即使用户输入的关键字不在其中,也可实现有效搜索)?
2005年8月,Google被迫暂停扫描图书,并在重启该项目时增加了由出版社向其提交“禁扫”清单的补注。
今年8月9日,美国加州大学的最新加入显示了Goolge的耐心和毅力。2006年6月,Google“图书搜索”项目落地中国。
“‘图书馆计划’会有别于Google全球。”8月4日,Google图书搜索中国项目负责人陈宇华在接受采访时透露,因为Google希望符合当地法律,中国“图书馆计划”的具体合作条款还未确定。
这一法律是指——今年7月出台的《信息网络传播权保护条例》。因为“图书馆无权全文开放馆藏”,其从精神上否定了此前Google式“图书馆计划”的合法性。
因此,在中国率先落地的是Google的“出版社计划”。至今,Google的合作方已包括清华大学出版社、少年儿童出版社、高等教育出版社和中信出版社。
百度——“中国”式反击
出于同样的资本意志,今年年初,百度(BADU,Nasdaq)开始谋略“万卷”项目。但与市值1060亿美金的Google相比,百度方式“剑走偏锋”,并希望以产业链合作的大门开启其另一利润点——“百度币”在数字内容方面的个人支付市场。
目前,百度“万卷”的合作方已包括——北大图书馆、超星图书、书生电子、北大方正和中科院国家科学图书馆,已拥有全球最大的中文图书可检索数量。
“这是图书馆的自我变革。”中科院国家科学图书馆馆长张晓林在接受采访时强调,读者的信息环境已发生变化,图书馆的目的是让更多人阅读到信息。
在国内相关法律限制下,百度同时吸取了Google的前车之鉴,“万卷”图书馆的合作模式为——不扫描、复制、存储图书内容,而是在搜索平台提供合作方的书目检索,并提供对方网站链接。
与此同时,百度采取的另一捷径是——与电子出版商合作。“因为它们一般已与出版社谈妥版权。”据一位接近百度的消息人士透露,它们拥有的海量电子书目信息还可帮助百度节约将内容搬到网上的资金和时间成本。
在与电子出版商的合作上,百度提供由其提供的图书检索相关信息和全文检索。但与Google富有侵略性的模式相比,百度失去的却是——产业链上的控制力。
“全文扫描,形成更垄断性的话语权是‘Google模式’的好处,但必须付出高额资金、时间和‘被诟病’的成本。”上述分析人士认为,与Google市值差异巨大的百度,虽然能用产业链合作最大程度规避资金投入和利益天谴,但提供的仅是一个平台,并没有如Google部分书籍通过图书馆跳过出版商一样跳过电子出版商。“因此,百度扮演的更是一个‘产业整合者’的角色。”
“这是百度的机会。”上述消息人士透露,除通过“万卷”增加内容外,百度目的并非只是广告增长。“虽然百度目前仅提供书目检索,但将来必进军内容,愿意向百度提供数字内容的合作方,将与百度一起分享‘百度币’分成。”
“百度币”是由百度推出的站内支付虚拟货币,其使用范围已包括“百度影视”、“百度传情”等。据上述人士透露,因为“竞价排名”模式的单一,百度正在考虑加强个人支付产品的业务。
“通过搭建图书、音乐、视频等数字内容销售平台,内容提供商供给‘产品’,由‘百度币’结算。如果这一富有中国特色的虚拟币成为标准,对在中国市场拥有流量优势的百度,可能比图书搜索更为重要。”他说。
竞争人类知识数字化
巴比伦塔建设的参与者,并不只有类似Google和百度这样的商业公司。
在刚过去的8月,世界两大非牟利电子书组织──古腾堡计划和世界电子书图书馆举办为期一个月的30万本免费书展,任何人都可以免费下载。
他们同样是巴比伦塔的建设者——过了版权保护期限的作品进入“公共领域”(Public Domain),属于全人类共同拥有。“古腾堡计划”创始人Michael Hart说,如果资助者认为Google能够独立完成这项事业,那么他的项目和其它公共项目将会受到损害。
Google的举措或许会带来健康的竞争,增加对公共信息服务的需求。但人们的担心在于——巴比伦塔作为人类的共同事业,Google作为重建者却显示出了“文化动机”的危险。
“第一批数字化书籍已显示Google‘以美国为中心’的书目选择。”法国国家图书馆馆长让·诺埃尔·让纳内发表论文《当Google向欧洲挑战的时候——为奋起辩护》,论述说——“美国出版物可能会压倒‘多数’”;“美语化的英语将加快吞噬欧洲其它语种的进程”。
2005年9月,法国总统希拉克宣布,为应对“文化新魔鬼”——Google和雅虎等美国新媒体势力的垄断,法国政府将投入20亿欧元资助欧洲高科技公司,创建属于法国的搜索引擎。
这恐怕比“图书搜索”单纯的商业竞争对手——微软、雅虎——等更让Google头痛,因为这是欧盟23个成员国国家图书馆、6个国家元首和政府邀请作者发起的文化讨伐,他们将为此组建“欧洲数字图书馆”。
另一个关键问题是商业动机——对利润的追求必将导致商品化的选择。
“广告在Google的整个运行中占据可怕分量。”让纳内说,尽管Google不在左侧“竞价排名”,但依然在右侧推行“竞价与相关性”相结合的广告方式。“发行书籍的主次排列将受广告效益的支配。”他认为,后果之一是——书籍领域可能让一些没有争议、平庸的作品充斥屏幕。
在这一商业动机上,以“竞价排名”为重要商业模式的百度同样应受到追问。对此,中科院国家科学图书馆业务处处长刘细文认为:“政府是否应在这样一个波及人类文明的事业中扮演一定角色,以有限遏止过于明显的商业行为?”