什么是Web 2.0——下一代软件的设计模式和商业模式(上)

来源:百度文库 编辑:神马文学网 时间:2024/05/01 00:53:27
2008-06-24 13:36
作者:Tim O'Reilly
09/30/2005
原文:What is Web 2.0
译者:玄伟剑
2001年秋天互联网公司(dot-com)泡沫的破灭标志着互联网的一个转折点。许多人由此断定互联网是被大家过分炒作了,事实上网络泡沫和相继而来的股市大衰退是所有技术革命的共同特征。股市大衰退通常标志着蒸蒸日上的技术已经开始占领中央舞台,假冒者被驱逐,而真正成功的故事将展示它们的力量,同时人们开始理解了是什么将一个故事同另外一个区分开来。
“Web 2.0”的概念开始于一个会议中——O'Reilly公司和MediaLive国际公司之间的头脑风暴(BrainStrom)阶段。互联网先驱、O'Reilly公司副总裁的DaleDougherty讲到:同所谓的“崩溃”迥然不同,互联网比其他任何时候都更重要,令人激动的新应用程序和网站正在以令人惊讶的规律性涌现出来。更重要的是,那些幸免于当初网络泡沫的公司看起来有一些共同的特点。那么会不会是互联网公司那场泡沫的破灭标志了互联网的一种转折?以至于呼吁“Web2.0”的行动有了意义?我们都认同这种观点,Web 2.0会议由此诞生。
在那个会议之后的一年半时间里“Web 2.0”一词已经深入人心,从Google上可以搜索到950万以上的链接。但是,至今关于Web 2.0的含义仍存在极大的分歧,一些人将Web 2.0贬低为毫无疑义的一个行销炒作口号,而其他一些人则将之理解为一种新的传统理念。
本文就是来尝试澄清Web 2.0的本来意义。
在当初的头脑风暴讨论中,我们已经用了一些例子公式化地表达了我们对Web 2.0的理解:
Web 1.0 Web 2.0
DoubleClick --> Google AdSense
Ofoto --> Flickr
Akamai --> BitTorrent
mp3.com --> Napster
大英百科全书在线(Britannica Online) --> 维基百科全书(Wikipedia)
个人网站 --> 博客(blogging)
evite --> upcoming.org和EVDB
域名投机 --> 搜索引擎优化
页面浏览数 --> 每次点击成本
屏幕抓取(screen scraping) --> 网络服务(web services)
发布 --> 参与
内容管理系统 --> 维基
目录(分类) --> 标签(“分众分类”,folksonomy)
粘性 --> 聚合
这个列表还会不断继续下去。但是到底是什么使得我们认定一个应用程序或一种方式是所谓的“Web 1.0”、而把另外一个叫做“Web2.0”呢?(这个问题尤为紧迫,因为Web2.0的观念已经传播得如此广泛,以至于很多公司正在将这个词加到他们的行销炒作中,但却没有真正理解其含义。同时这个问题也尤为困难,因为许多嗜好口号的创业公司显然不是Web 2.0,而一些我们认为是Web2.0的应用程序,例如Napster和BitTorrent,甚至不是真正适当的Web应用程序!)我们首先来探讨一些原则,这些原则是通过Web1.0的一些成功案例以及一些最为有趣的新型应用程序来体现的。
1. 互联网作为平台
正如许多重要的理念一样,Web 2.0没有一个明确的界限,而是一个重力核心。不妨将Web 2.0视作一组原则和实践,由此来把距离核心或远或近的网站组成为一个类似太阳系的网络系统,这些网站则或多或少地体现着Web 2.0的原则。

图1为Web 2.0的“模拟图”,该图是在名为“Friend Of O'Reilly,(FOO,O'Reilly的朋友)”会议中的一个研讨会上产生的。这个图基本上仍处于演化阶段,但已经描绘出了从Web 2.0核心理念中衍生出的许多概念。
例如,在2004年10月的第一次Web 2.0的会议上,约翰·巴特利(John Battelle)和我在我们各自的开场白中列举了一组初步的原则。
这些原则中的第一条就是“互联网作为平台”。这也曾是Web1.0的宠儿网景公司(Netscape)的战斗口号,而网景在同微软的大战中陨落了。此外,我们早先的Web1.0的楷模中的两个、DoubleClick和Akamai公司、皆是将网络当作平台的先驱。人们往往不认为这是一种网络服务,但事实上广告服务是第一个被广泛应用的网络服务,同时也是第一个被广泛应用的混合处理(mashup),如果用另一个近来流行的词来说的话。每个旗帜广告(bannerad)都是用来在两个网站之前无缝合作,向位于另外一台计算机上的读者传递一个整合好的页面。Akamai也将网络看作平台,并且在一个更深入的层次上来搭建一个透明的缓存和内容分发网络,以便降低带宽的拥塞程度。
虽然如此,这些先驱提供了有益的对比,因为后来者遇到同样问题的时候可以将先驱们的解决方案进一步延伸,从而对新平台本质的理解也更为深刻。DoubleClick和Akamai都是Web 2.0的先驱,同时我们也可以看到,可以通过引入更多Web 2.0的设计模式来实现更多的应用。
让我们对这三个案例中的每一个都作一番深究,来探讨其间的一些本质性的差别。
Netscape对Google
如果Netscape可以称为Web 1.0的旗手的话那么Google几乎可以肯定是Web 2.0的旗手,只要看看他们的首次公开上市(IPO)是如何地揭示了各自的时代就清楚了。所以我们就从这两个公司及其定位的差别入手。
Netscape以传统的软件摹本来勾勒其所谓“互联网作为平台”:他们的旗舰产品是互联网浏览器,一个桌面应用程序。同时,他们的战略是利用他们在浏览器市场的统治地位来为其昂贵的服务器产品建立起市场。从理论上讲,在浏览器中控制显示内容和程序的标准赋予了Netscape一种市场支配力,如同微软公司在个人计算机市场上所享受到的一样。很像当初“自行的马车”(horselesscarriage)将汽车描绘为一种熟知事物的延伸,Netscape曾推销一种网络桌面(webtop)来替代传统的桌面(desktop),并且计划借助信息更新以及由购买了Netscape服务器的信息提供者来推送的各种小程序,来开发推广这种网络桌面。
最终,浏览器和网络服务器都变成了“日用品”,价值链条也向上移动到了在互联网平台上传递的服务。
作为对比,Google则以天生的网络应用程序的角色问世,它从不出售或者打包其程序,而是以服务的方式来传递。客户们直接或间接地为其所使用的服务向Google付费。原有软件工业缺陷荡然无存。没有了定期的软件发布,只需要持续的改善。没有了许可证或销售,只需要使用。没有了为了让用户在其设备上运行软件而不得不进行的平台迁移,只需要搭建宏大的、由众多个人计算机组成的、可伸缩的网络,其上运行开源操作系统及其自行研制的应用程序和工具,而公司之外的任何人则永远无法接触到这些东西。
在其底层,Google需要一种Netscape从未需要过的能力:数据库管理。Google远远不只是一个软件工具的集合,它是一个专业化的数据库。没有这些数据,那些工具将毫无用武之地;没有这些软件,数据也将无可控制。软件许可证制度和对应用程序接口(API)的控制——上一个时代的法宝——已经无关紧要了,因为Google的软件只需要执行而从不需要分发,也因为如果不具备收集和管理数据的能力软件本身就没有什么用处了。事实上,软件的价值是同它所协助管理的数据的规模和活性成正比的。
Google的服务不是一个简单的服务器,虽然其服务是通过大规模的互联网服务器集合来传递的;其服务也不是一个浏览器,虽然这种服务是被用户在浏览器中体验到的。Google的旗舰产品——搜索服务——甚至不缓存它让用户来搜寻的内容。很像一个电话通话过程,不仅发生在通话的两端,而且发生在中间的网络上。作为用户和其在线体验的一个中介,Google作用于浏览器、搜索引擎和最终的内容服务器之间的空间中。
虽然Netscape和Google都可以被描述为软件公司,但显然Netscape可以归到Lotus、Microsoft、Oracle、SAP以及其他发源于上个世纪八十年代软件革命的那些公司所组成的软件世界中。而Google的同伴们则是像eBay、Amazon、Napster及至DoubleClick和Akamai这样的互联网公司。
DoubleClick对Overture和AdSense
同Google类似,DoubleClick是一个名副其实的互联网时代的孩子。它把软件作为一种服务,在数据管理方面具有核心竞争力,并且正如上文所述,它是一个早在连网络服务的名字还不曾有的时候就已然开始其服务的先驱。然而,DoubleClick最终还是被其商业模式局限住了。它所贯彻的是上世纪九十年代的互联网观念。这种观念围绕着出版,而不是参与;围绕着广告客户,而不是消费者,来进行操纵;围绕着规模,认为互联网会被如MediaMetrix等网络广告评测公司尺度下的所谓顶级网站所统治。
结果是DoubleClick得意地在其网站上引用道:“超过2000种的成功应用”。而相对比的是Yahoo!公司的搜索市场(从前的Overture)和Google的AdSense产品已经在为几十万的广告客户服务了。
Overture和Google的成功源自于对克里斯·安德森(ChrisAnderson)提到的所谓“长尾”的领悟,即众多小网站集体的力量提供了互联网的大多数内容。DoubleClick的产品要求一种签订正式的销售合同,并将其市场局限于很少的几千个大型网站。Overture和Google则领会到如何将广告放置到几乎所有的网页上。更进一步地,它们回避了发行商和广告代理们所喜爱的广告形式,例如旗帜广告和弹出式广告,而采用了干扰最小的、上下文敏感的、对用户友好的文字广告形式。
Web 2.0的经验是:有效利用消费者的自助服务和算法上的数据管理,以便能够将触角延伸至整个互联网,延伸至各个边缘而不仅仅是中心,延伸至长尾而不仅仅是头部。
毫不奇怪,其他Web2.0的成功故事也显示着同样的轨迹。eBay扮演着一个自动的中间媒介角色,使个体之间发生的几个美元的偶然性的交易成为可能。Napster(虽然已经出于法律原因而关闭)将其网络建立在一个集中的歌曲数据库之上,但是它让每一个下载者都成为一台服务器,从而使其网络逐渐扩大。
Akamai对BitTorrent
同DoubleClick类似,Akamai的业务重点面向网络的头部,而不是尾部;面向中心,而不是边缘。虽然它服务于那些处于网络边缘的个体的利益,为他们访问位于互联网中心的高需求的网站铺平了道路,但它的收入仍然来自那些位于中心的网站。
BitTorrent,像P2P风潮中的其他倡导者一样,采用了一种激进的方式来达到互联网去中心化(internetdecentralization)的目的。每个客户端同时也是一个服务器;文件被分割成许多片段,从而可以由网络上的多个地方提供,透明地利用了网络的下载者来为其他下载者提供带宽和数据。事实上,文件越流行下载得越快,因为有更多的用户在为这个文件提供带宽和各个片段。
BitTorrent由此显示出Web2.0的一个关键原则:用户越多,服务越好。一边是Akamai必须增加服务器来改善服务,另一边是BitTorrent用户将各自的资源贡献给大家。可以说,有一种隐性的“参与体系”内置在合作准则中。在这种参与体系中,服务主要扮演着一个智能代理的作用,将网络上的各个边缘连接起来,同时充分利用了用户自身的力量。
2. 利用集体智慧
在诞生于Web 1.0时代并且存活了下来、而且要继续领导Web 2.0时代的那些巨人的成功故事背后,有一个核心原则,就是他们借助了网络的力量来利用集体智慧:
超级链接是互联网的基础。当用户添加新的内容和新的网站的时候,将被限定在一种特定的网络结构中,这种网络结构是由其他用户发现内容并建立链接的。如同大脑中的神经突触,随着彼此的联系通过复制和强化变得越来越强,而作为所有网络用户的所有活动的直接结果,互联的网络将有机地成长。 Yahoo!是首例伟大的Internet成功故事,诞生于一个分类目录,或者说是链接目录,一个对数万甚至数百万网络用户的最精彩作品的汇总。虽然后来Yahoo!进入了创建五花八门的内容的业务,但其作为一个门户来收集网络用户们集体作品的角色依然是其价值核心。 Google在搜索方面的突破在于PageRank技术,该技术令其迅速成为搜索市场上毫无争议的领导者。PageRank是一种利用了网络的链接结构(而不是仅仅是使用文档的属性)来实现更好的搜索效果的方法。 eBay的产品是其全部用户的集体活动,就像网络自身一样,eBay随着用户的活动而有机地成长,而且该公司的角色是作为一个特定环境的促成者,而用户的行动就发生在这种环境之中。更重要的是,eBay的竞争优势几乎都来自于关键性的、大量的买家和卖家双方,而正是这一点使得后面许多竞争者的产品的吸引力显著减低。 Amazon销售同Barnesandnoble.com等竞争者相同的产品,同时这些公司从卖方获得的是同样的产品描述、封面图片和目录。所不同的是,Amazon已然缔造出了一门关于激发用户参与的科学。Amazon拥有比其竞争者高出一个数量级以上的用户评价以及更多的邀请,来让用户以五花八门的方式、在近乎所有的页面上进行参与,而更为重要的是,他们利用用户的活动来产生更好的搜索结果。Barnesandnoble.com的搜索结果很可能指向该公司自己的产品,或者是赞助商的结果,而Amazon则始终以所谓“最流行的”打头,这是一种实时计算,不仅基于销售,而且基于其他一些被Amazon内部人士称为围绕着产品“流动”(flow)的因素。由于拥有高出对手一个数量级的用户参与,Amazon销售额超出竞争对手也就不足为奇了。
平台总是打败应用程序
在过去每次同对手的竞争中,微软都成功地打了平台这张牌,打败了即便是最占主导地位的应用程序。Windows平台让微软以Excel取代了Lotus1-2-3,以Word取代了WordPerfect,以Internet Explorer取代了Netscape浏览器。
不过这次,冲突不是在平台和应用程序之间,而是在两种平台之间。每个平台皆有一种截然不同的商业模式:一方面,一个独立软件商具有广泛的用户基础并且将应用程序接口和操作系统紧密集成,从而对程序设计模式予以控制;另一方面,是一个没有所有者的系统,由一组协议、开放标准和对合作的共识来连结到一起。
Windows系统代表了由软件程序接口来进行专有控制的高峰。Netscape曾尝试用微软当初对付其对手所使用的手段来同微软进行争夺,但是失败了。然而拥有互联网开放标准的Apache却已经繁荣了起来。此番上演的战局,已经不再是实力悬殊的平台对决孤立的软件了,而是变成了平台对决平台。问题在于,哪个平台,或者更深远地来说哪个体系,以及哪个商业模式,最能适应未来的机遇。
Windows对于早期的PC时代的问题是一种卓越的解决方案。它统一了程序开发者的竞技场,解决了很多困扰这个领域的问题。但这种由单一供方控制的一刀切的方法已经不再是适宜的解决方案,而成为了一种问题。面向交流的系统需要协同性,互联网作为一个平台当然也是如此。除非供方可以控制每一例交互的两个终端,这种通过软件的程序接口来锁定用户的可能性微乎其微。
任何企图通过控制平台来推销应用程序的Web 2.0提供商,从定义上讲,已经丧失了这个平台的优越性。
这并不是说锁定和抢占竞争优势的机会不复存在了,而是说我们相信这种机会不是通过控制软件程序接口和协议来取得的。新的游戏规则正在浮现。那些能够理解这些新的游戏规则而不是企图回到PC软件时代旧有规则的公司,才有可能在Web 2.0时代获得成功。
现在,具备了这种洞察力并且可能会将之延伸开来的那些创新型的公司,正在互联网上留下他们的印迹。
维基百科全书(Wikipedia)是一种在线百科全书,其实现基于一种看似不可能的观念。该观念认为一个条目可以被任何互联网用户所添加,同时可以被其他任何人编辑。无疑,这是对信任的一种极端的实验,将埃里克·雷蒙德(Eric Raymond)的格言(源自开放源代码软件的背景之下):“有足够的眼球,所有的程序缺陷都是肤浅的”(with enough eyeballs, all bugs areshallow)运用到了内容的创建之中。维基百科全书已然高居世界网站百强之列,并且许多人认为它不久就将位列十强。这在内容创建方面是一种深远的变革。 像del.icio.us(美味书签)和Flickr这样的网站,其公司已经在近期获得了广泛的关注,并且已经在一种被人们称为“分众分类”(folksonomy,有别于传统分类法)的概念上成为先行者。“分众分类”是一种使用用户自由选择的关键词对网站进行协作分类的方式,而这些关键词一般称为标签(tags)。标签化运用了像大脑本身所使用的那种多重的、重叠的关联,而不是死板的分类。举一个经典的例子,在Flickr网站上,一幅小狗照片可能被加上“小狗”和“可爱”这样的标签,从而允许系统依照用户行为所产生的自然的方式来进行检索。 协作式垃圾信息过滤产品,例如Cloudmark,就聚集了电子邮件用户们对于“一封邮件是或者不是垃圾邮件”的众多相互独立的决策,从而胜过了依赖于分析邮件本身的那些系统。 伟大的互联网成功者并不主动地到处推销其产品,这几乎成为公理。他们采用“病毒式营销”(viral marketing)的方式,也就是说,一些推介会直接从一个用户传播到另外一个用户。如果一个网站或产品依赖广告来进行宣传,你几乎可以断定它不是Web 2.0。 即便许多互联网基础设施本身,包括在大多数网络服务器中用到的Linux、Apache、MySQL以及Perl、PHP或Python代码,也都依靠开放源代码的对等生产(peer-production)的方式。其中包含了一种集体的、网络赋予的智慧。在SourceForge.net网站上列有至少10万种开放源代码软件项目。任何人都可以添加一个项目,任何人都可以下载并使用项目代码。同时,由于用户使用的结果,新的项目从边缘迁移到中心。一个对软件的有机的接受过程几乎完全依靠病毒式营销。
经验是:源于用户贡献的网络效应,是在Web 2.0时代中统治市场的关键。
博客和大众智慧
Web 2.0时代一项最受追捧的特性就是博客的兴起。个人主页从互联网早期就已经存在了,而个人日记和每日发表观点的专栏就更渊源久远了,那么到底有什么让人大惊小怪的呢?
归根底地,博客只是一种日记形式的个人网页。但正如里奇·斯格仁塔(Rich Skrenta)指出的,博客的按时间顺序来排列的结构“看起来像是一个微不足道的变化,但却推动着一个迥然不同的分发、广告和价值链。”
其中一大变化就是一项称为RSS的技术。RSS是自早期计算机高手们认识到CGI(公共网关接口)可用来创建以数据库为基础的网站以来在互联网根本结构方面最重要的进步。RSS使人们不仅仅链接到一个网页,而且可以订阅这个网页,从而每当该页面产生了变化时都会得到通知。斯格仁塔将之称为“增量的互联网”(incrementalweb)。其他人则称之为“鲜活的互联网”(live web)。
当然,现在所谓“动态网站”(即具有动态产生的内容的、由数据库驱动的网站)取代了十年前的静态网站。而动态网站的活力不仅在于网页,而且在链接方面。一个指向网络博客的链接实际上是指向一个不断更新的网页,包括指向其中任何一篇文章的“固定链接”(permalinks),以及每一次更新的通知。因此,一个RSS是比书签或者指向一个单独网页的链接要强大得多。
RSS同时也意味着网页浏览器不再只是限于浏览网页的工具。尽管诸如Bloglines之类的RSS聚合器(RSS aggregators)是基于网络的,但其他的则是桌面程序,此外还有一些则可以用在便携设备上来接受定期更新的内容。
RSS现在不仅用于推送新的博客文章的通知,还可以用于其他各种各样的数据更新,包括股票报价、天气情况以及图片。这类应用实际上是对RSS本源的一种回归:RSS诞生于1997年,是如下两种技术的汇合,一种是戴夫·温纳(Dave Winer)的“真正简单的聚合”(Really SimpleSyndication)技术,用于通知博客的更新情况;另一种是Netscape公司提供的“丰富站点摘要”(Rich SiteSummary)技术,该技术允许用户用定期更新的数据流来定制Netscape主页。后来Netscape公司失去了兴趣,这种技术便由温纳的一个博客先驱公司Userland承接下来。不过,在现在的应用程序实现中我可以看出两者共同的作用。
但是,RSS只是令博客区别于普通网页的一部分原因。汤姆·科特斯(Tom Coates)这样评论固定链接的重要性:
“现在它可能看上去像是一项普普通通的功能,但它却有效地将博客从一个易于发布(ease-of-publishing)的现象,进一步转变为互相交叉的社区的一种对话式的参与。这是首次使得对其他人的网站上的很特定的帖子表态和谈论变得如此地容易。讨论出现了,聊天也出现。同时,其结果是出现了友谊或者友谊更加坚固了。固定链接是第一次也是最为成功的一次在博客之间搭建桥梁的尝试。”
在许多方面,RSS同固定链接的结合为HTPP增添了NNTP(新闻组的网络新闻协议)的许多特性。所谓“博客圈”(blogosphere),可以将其视作一种同互联网早期的、以对话方式来灌水的新闻组和公告牌对等(peer-to-peer)意义上的等价现象。人们不仅可以相互订阅网站并方便地链接到一个页面上的特定评论,而且通过一种称为引用通告(trackbacks)的机制,可以得知其他任何人链接到了他们的页面,并且可以用相互链接或者添加评论的方式来做出回应。
有趣的是,这种双向链接(two-waylinks)曾是像Xanadu之类的早期超文本系统的目标。超文本纯粹论者已然将引用通告颂扬为向双向链接迈进了一步。但需要注意的是,引用通告不是一个真正的双向链接,确切地讲是一种(潜在地)实现了双向链接效果的对称式单向链接。其间的区别看起来可能很细微,但实际上却是巨大的。诸如Friendster、Orkut和LinkedIn那样的社交网络系统(social networkingsystems),需要接受方做出确认以便建立某种连接,从而缺少像互联网架构本身那样的可伸缩性。正如照片共享服务Flickr网站的创始人之一卡特里纳·费克(CaterinaFake)所指出的,注意力仅在碰巧时才礼尚往来。(Flickr因此允许用户设置观察列表,即任何用户都可以通过RSS来订阅其他所有用户的照片流。注意的对象将会被通知,但并不一定要认可这种连接。)
如果Web2.0的一个本质是利用集体智慧来将互联网调试为一种所谓的全球的大脑,那么博客圈就是前脑中喋喋不休的呓语,那种我们整个头脑中都能听到的声音。这可能并不反映出大脑往往是无意识的深层结构但却是一种有意识的思考的等价物。作为一种有意识的思考和注意力的反映,博客圈已经开始具有强有力的影响了。
参与的体系
一些系统被设计为鼓励参与。在丹·布莱克林(Dan Bricklin)的论文“共用的丰饶”(The Cornucopia of the Commons)中,他指出有三种创建大型数据库的方式。第一种,已经由Yahoo!来体现了,就是付费给人们来实现。第二种,由开放源代码社区的经验启发而来,就是让志愿者来完成同样的任务。开放目录项目(Open Directory Project),一个Yahoo的开放源代码竞争者,就是该方式的产物。但是Napster体现了第三种方式。因为Napster将其默认设置为自动将任何已经下载的音乐提供给其他人下载,任何用户都自动地帮助建立共享数据库的价值。同样的方式已经被其他所有P2P文件共享服务所采用。
Web2.0时代的一个关键经验在于:用户增加价值。但是只有很小一部分用户会有意来为你的程序增加价值,而不怕麻烦。因而,Web2.0公司均进行了这样的默认设置,即作为程序通常使用方式的副产品来聚合用户数据并创造价值。正如上面所指出的,他们在搭建那种用户越多则效果越好的系统。
米切尔·卡普尔(Mitch Kapor)曾经指出“体系是策略”。参与是Napster的本质,是其根本体系的一部分。
同更经常被引用的所谓“吸引志愿精神”相比,这种体系结构上的洞察力可能更能抓住开放源代码软件成功的本质。互联网、万维网(World WideWeb)、以及像Linux、Apache和Perl这样的开放源代码软件项目的体系结构均是这样一种设计,使得作为一种自动产生的副产品,谋求其自身利益的用户们创建着集体的价值。这些项目中的任何一个都有一个很小的核心、一种设计良好的扩展机制、和一种让任何人来添加任何合乎规定的组件的方式,从而不断增长着被Perl语言的创始人拉里·沃尔(Larry Wall)称为“洋葱头”(theonion)的外部层面。换句话说,这些技术通过他们本来的设计方式体现着网络的效应。
首先,因为搜索引擎使用链接结构来辅助预测有用的页面,作为最多产和最及时的链接者,博客们在修整搜索引擎结果方面充当着一种不成比例的角色。其次,因为博客社区是如此多地自相引用,关注其他博客的博客们开阔了他们的视野和能力。此外,评论家们所批判的“回音室”(echochamber)也是一种放大器。
如果只是一种放大器那么撰写博客将会变得无趣。但是像维基百科全书一样,博客将集体智慧用作一种过滤器。被詹姆士·苏瑞奥维奇(James Suriowecki)称为“大众智慧”(the wisdom of crowds)的规律起了作用,并且就像PageRank技术所产生的结果胜过分析任何单一文档一样,博客圈的集体关注会筛选出有价值的东西。
虽然主流媒体可能将个别的博客视为竞争者,但真正使其紧张的将是同作为一个整体的博客圈的竞争。这不仅是网站之间的竞争,而且是一种商业模式之间的竞争。Web 2.0的世界也正是丹·吉尔默(Dan Gillmor)的所谓“个人媒体”(We,the media)的世界。在这个世界中,是所谓“原本的听众”而不是密室里的少数几个人来决定着什么是重要的。
3. 数据是下一个Intel Inside
现在每一个重要的互联网应用程序都由一个专门的数据库驱动:Google的网络爬虫,Yahoo!的目录(和网络爬虫),Amazon的产品数据库,eBay的产品数据库和销售商,MapQuest的地图数据库,Napster的分布式歌曲库。正如哈尔·瓦里安(Hal Varian)在去年的私人对话中谈到的,“SQL是新的HTML”。数据库管理是Web2.0公司的核心竞争力,其重要性使得我们有时候称这些程序为“讯件”(infoware)而不仅仅是软件。
该事实也引出了一个关键问题:谁拥有数据?
在互联网时代,我们可能已经见到了这样一些案例,其中对数据库的掌控导致了对市场的支配和巨大的经济回报。当初由美国政府的法令授权给NetworkSolutions公司(后被Verisign公司收购)对域名注册的垄断曾经是互联网上的第一个摇钱树。虽然我们在争论通过控制软件的API来形成商业优势在互联网时代会变得困难得多,但是对关键数据资源的控制则不同,特别是当要创建这些数据资源非常昂贵、或者经由网络效应容易增加回报的时候。
注意一下由MapQuest、maps.yahoo.com、maps.msn.com、或者maps.google.com等网站提供的每张地图下面的版权声明,你会发现这样一行字“地图版权NavTeq,TeleAtlas”,或者如果使用的是新的卫星图像服务,则会看到“图像版权DigitalGlobe”的字样。这些公司对其数据库进行了大量的投资。(仅NavTeq一家就公布投资7.5亿美元用于创建其街道地址和路线数据库。DigitalGlobe则投资5亿美元来启动其自有卫星,来对政府提供的图像进行改进。)NavTeq竟然已做了很多模仿Intel的耳熟能详的IntelInside标识的事:例如带有导航系统的汽车就带有“NavTeq Onboard”的印记。数据是许多此类程序事实上的IntelInside,是一些系统的唯一的信息源组件,这些系统的软件体系多数是开放源代码的,也有商业化的。
当前竞争火热的网络地图(webmapping)领域显示:对拥有软件核心数据的重要性的疏忽大意,将最终削弱其竞争地位。MapQuest在1995年率先进入地图领域,随后是Yahoo!,再后来是Microsoft,而最近Google也决定挺进这一市场,他们可以轻松地通过对同一数据的授权来提供一个具有竞争力的程序。
然而,作为对比的是Amazon.com的竞争地位。像Barnesandnoble.com这样的竞争者一样,其原始数据库来自于ISBN注册商R.R.Bowker。但是同MapQuest不同,Amazon大力增强其数据,增加出版商提供的数据,例如封面图片、目录、索引和样张材料。更重要的是,他们利用了其用户来评注数据,以至于十年之后,是Amazon而不是Bowker成为图书文献信息的主要来源,一个学者、图书管理员和消费者的参考书目来源。Amazon还引入了其专有的标识符,即ASIN,该标识符在ISBN存在时与之对应,而当产品不带有ISBN时就创建出一个等价的命名空间。Amazon从而有效地“吸收和拓展了”其数据提供商。
设想如果MapQuest也已做了同样的事情,利用他们的用户来评注地图和路线,添加新的价值层面。那么对仅仅通过授权使用基础数据来进入这一市场的其他竞争者,将造成远远大得多的困难。
近期Google地图的引入,为应用程序销售商和其数据提供商之间的竞争提供了一个活生生的实验室。Google的轻量型编程模型已经引发了不计其数的增值服务的出现,这些服务以数据混合的方式将Google的地图同其他可以通过互联网访问的数据源相结合。保罗·拉特马赫(PaulRademacher)的housingmaps.com是这种混合的一个上佳范例,其网站将Google的地图同Craigslist的公寓出租以及住宅购买数据相结合,来创建一种交互式的房屋搜索工具。
目前,这些结合大多还都是由程序高手们实现的创新性的实验产品。但是企业行动将紧随其后。并且,人们已经可以从至少一类开发者中发现这一点。Google已经将数据源提供者的角色从Navteq那里夺走,并且将自己定位为一个令人喜爱的中介者。在以后几年里,我们将会看到数据提供商和程序销售商之间的斗争,因为两大阵营都认识到了:特定的数据类别在作为搭建Web 2.0程序的积木时是多么的重要。
这场竞赛已经涉及到拥有特定类别的核心数据:位置、身份、公共事件日历、产品标识和命名空间等。在许多情况下,在那些创建数据需要巨额成本的地方,也可能存在一种如同IntelInside方式凭借单一数据源来有所作为的机遇。其他情况下,胜者将是那些通过用户聚合来达到临界规模并且将聚合的数据融入系统服务中的公司。
比如,在身份标识领域PayPal、Amazon的一键式以及拥有数百万用户的交流系统,都有可能成为创建整个网络范围的身份标识数据库的正当竞争者。(关于此,Google最近使用手机号码作为Gmail账号标识的尝试,可能就是朝借鉴和拓展电话系统所迈出的一步。)同时,像Sxip这样的创业公司正在探索联合身份标识的可能性,以寻求一种“分布一键式”,从而提供一个无缝的Web 2.0标识子系统。在日历领域,EVDB则是通过维基式参与体系来搭建世界上最大的共享日历的一种尝试。虽然评判者尚在观望着任何一个特定创业公司或方式的成功与否,但很显然这些领域的标准和解决方案有效地将某些数据转变为“互联网操作系统”(internet operating system)的可靠的子系统,并将促成下一代的应用程序。
关于数据,必须注意一个进一步的方面,那就是用户关心其隐私和对自己的数据的权限。在许多早期的网络程序中,版权只被松散地执行。例如,Amazon宣称对任何提交到其网站的评论的所有权,但却缺少强制性,人们可以将同样的评论转贴到其他任何地方。然而,随着很多公司开始认识到对数据的掌控有可能成为他们首要的竞争优势来源,我们将会看到在此类控制方面强度更大的尝试。
正如专有软件的增长而导致自由软件运动一样,在下一个10年中我们会看到专有数据库的增长将导致自由数据运动。在像维基百科全书这样的开放数据项目、创作共用(Creative Commons)、以及像Greasemonkey(让用户决定如何在其计算机上显示数据)这样的软件项目中,我们可以看到这种对抗势头的前兆。