信息的生产、获取、组织与呈现

来源:百度文库 编辑:神马文学网 时间:2024/04/25 06:42:10
信息的生产、获取、组织与呈现(上)
  • 信息的生产、获取、组织与呈现(上)
  • 信息的生产、获取、组织与呈现(中)
  • 信息的生产、获取、组织与呈现(下)

本文谢绝转载

你能想像Google的首页变成Yahoo首页的风格么? 欢迎在i.b.bbs的文后留下你对Yahoo版Google首页的看法。

虽然Google的首页对于互联网而言已经成为经典且被广为传颂,但是我必须承认,如果将我经常使用的Google服务以Yahoo首页方式来导航和排列,我一定会欣然接受——虽然Google个性化首页可以部分实现,但是Yahoo的导航和布局在用户习惯上仍然有明显优势。这样的首页风格变化,至少告诉我们:“信息是可以多样组织的”,而这是我们现在要讨论的话题。

基本上,我认为,“信息的生产、获取、组织与在线”是互联网的基本问题,进而,可能是个人和社会的基本问题。如果我们引用“范式”这个概念的话,基本上,对这一问题在演进的过程中,会有若干“范式”存在(我们会不严格地使用“范式”这个词,来描述重大的信息流动方式的变化)。

前web时代。

如果我们从前web时代开始算起的话,那么在telnet和usenet方式下,信息的生产和今天web2.0的微内容时代“用户贡献内容”是一致的,但是在获取、组织和呈现上存在多样的差别。相比之下,Web的组织、呈现方式具有更好的适宜性,所以这一步基本是“范式”变革,而且看上去革命很彻底——为什么只是看上去,是因为尽管telnet和usenet已经极为少用,但是它们对信息组织的方式之原理仍然在web领域存在,甚至复苏和繁荣,比如google group对usenet方式的承袭。

Yahoo索引与hao123、265。

我们会反复提高Yahoo,因为它的历史基本同步于web的历史。

Yahoo从“索引”方式起步,这个时候,提供的“信息”是“内容的方向或者路径”,达到“导航”的效果,信息由编辑生产、组织,呈现方式简单明确,用户被动浏览。这个初期的信息需求同时也是基础的信息需求,所以hao123和265才能在幅员辽阔,人口众多尤其是初阶网民基数大且能因为源源不断的新上网人群得以维系这个基数的中国获得成功。

后者证明了索引方式今天依然有效,同时,索引方式在一些特定领域和特定内容也会长期有效。

Yahoo门户与新浪门户

Yahoo今天掌握了大量的web2.0网站或说是社区资源,使其在信息生产、获取、组织和再现的创造潜能巨大,应该说丝毫不弱于Google甚至在信息生产、tag等特定组织方式以及社会性方面尤有优势。其股价一再走低,是因为Yahoo还没有抛弃“媒体”而且是“大众媒体”的思路——在过去,Yahoo曾以挖来传统媒体的大腕来主持Yahoo而自豪,但这已不再能切脉新的互联网信息流动。

应该来说,新浪和过去那段黄金时期的Yahoo在“信息的生产、获取、组织与呈现”方面已经树立了一个范式,其典范作用今天发挥着广泛的影响力。以新浪为例,“免费的生产”即依赖于传统媒体的内容,然后以“秒”为计量单位进行组织、呈现,从而掐断了中国传统媒体的网络生机。回顾2000年及之前的认识,我们认为新浪的每条新闻下面能够呈现“相关新闻”,并且新闻内部有超链接而惊叹不已,因为它彻底改变了传统的信息的分散与独立,而将其关联起来,所以具有相比传统媒体更好的“信息组织”优势。当然,这种优势远不止此。

《纽约时报》或者《华盛顿邮报》在美国依然有机会按照互联网提供的优化的信息组织、呈现方式来对自己进行提升,但是, 它们要进行信息“生产”,而新浪直接“获取”,相比新浪具有优势。

内容的专业化生产依然有价值,即便在今天遭遇了web2.0带来的大众生产格局,专业化的生产依然有不可低估的价值,甚至从社会的目标来说,必须有大批专业人士来保证我们在众多领域的知情权。

Google甩掉Yahoo,搜索是一种信息获取方式

Yahoo认为“索引”,提供方向比提供具体的信息条目要有价值,于是放弃了“索引具体条目”的领域,拱手将“搜索”这一整个“范式”领域让给了Google——我们不得不承认,只有回头看,我们才发现“搜索”是信息的独特“获取组织和呈现”的方式,而不是一个仅仅的补充。当时,只有Google意识到他们在开辟新的方式。Yahoo要么“索引”,要么走向内容生产和大众媒体的信息道。

Google力图方便人们寻找信息,但是,每一个搜索条目,本身其实就是“信息”,就像yahoo的索引本身是信息和delicious里面每个网页的收藏条目是信息一样——麦克卢汉告诉我们:新媒体经常以旧媒介为内容。当每个搜索结果的呈现页面上能展示广告时,搜索结果本身成为媒体就已经是昭然的事实了。

Google用技术去获取信息,用技术去组织信息,用算法排序来呈现信息——纯粹的技术型思路,但是确实是新的“信息流动范式”。而这一范式,今天仍然在发挥力量。当我们疯狂玩耍BBS时,奇虎和过气的ChinaBBS能成为论坛的成果分享者;当我们创建一堆“分类网站”来满足生活需求是,Kooxoo出现了;当我们在相当多的数码站点分享咨讯和经验时,搜索依然可以跨平台地迅速占有“信息”……(此处不包含价值观的否定,因为搜索这种方式本身对内容提供的是增值,而不是“占有内容”,强化了信息流动的价值链;而国内一些“转载”、“iFrame”等则是掐断信息流动的价值链,从而让“优质信息的生产”这个最核心的部分遭到损害)

Google和Yahoo各自代表一种信息流动的范式,它们同时争夺未来的范式,谁会成为代表呢?

Google和Yahoo在web2.0的死磕

在web2.0时代,Google和Yahoo都是领先者,前者在核心架构“搜索”方面有长足优势,在用户、社区和web2.0应用方面有毫不逊色的基础,在未来的系统架构和技术储备方面同样优势明显,而且有很好的品牌优势和资金储备;后者有丰富的互联网经验,在信息组织、呈现方面有良好的经验,在用户、社区和web2.0应用方面有更为明显的优势和大量的社区储备,有强大的品牌和资源链条。但是,众多的收购并不代表未来。真正的未来竞争还是会基于“搜索”作为核心架构,因为核心竞争必然是搜索——无论拥有多少收购,搜索能够彻底实现“跨平台”,成为整个互联网的核心节点,这种竞争带来的结局是真正的结局。

无论如何,先让我们上演web2.0时代的信息生产、获取、组织与呈现。(待续,谢绝转载和假“收藏”、“dig”方式的全文转载)

web2.0之所以能成为2.0,不在于讨论其技术是否具有革命性,而在于“观念”的变革。对于这一点,已经从2005年讨论至今,即便很多人今天被迫接受“web2.0”这个词,他们仍然心怀不满,更为可惜的是,很多web2.0创业者对事情本身缺乏深入了解。

“信息的生产、获取、组织和呈现”的传统格局彻底被web2.0改变了,对这种改变的认识不仅应该放到某一个具体网站比如myspace、delicious、flickr、youtube等来思考,而且也应该放到整个互联网平台之上来思考,当然,每个网站都必须思考自身的“信息生产、获取、组织和呈现”的问题——我们说过,这是互联网的核心主题。

原本是希望在“语境网”这个话题之下来展开这篇长文的全部论述的,但是目前的论述更合适作为一个基础论述。 2005年中文网志年会上,我展开过两张图来解释为什么“we the web”,就是基于“信息的生产、获取、组织与呈现”来展开的,一直没有将其充分讨论,现在再拾起来。

web2.0的信息架构一、微内容与信息生产

“We the Web”之所以是现实,是因为web2.0的站点都要促进个人生产微内容,同时个人的微内容形成了一个“个人页”,然后个人页的汇聚及这些个人的关联构成了整个站点。参考下图:


(可参考 web2.0info.ppt

索引、门户、搜索都没有改变信息的生产格局,但是web2.0是完全建立在“信息生产”的革命之上的,它能促进网络内容的个体生产,即让“微内容”大幅度产生——很多人都认为,微内容是web2.0的基础,确实如此,因为微内容的出现,使得信息大量生产,于是带来了更多的信息获取、组织和呈现的问题,也就给互联网行业带来了更多的机会。

web2.0的信息架构二:信息组织多元化

web2.0分为两层意思,一是web2.0站点,包括比如BSP、文摘站点和图像分享站点这样的基本应用站点和行业垂直应用站点;二是整个互联网信息架构的变化,及大的范式革命。那么,整个互联网以什么方式来架构呢?参考下图:


(可参考 web2.0info.ppt

从上图可以看到,整个信息结构被分为三层:微内容层、组织层、应用层,其中,“数据”和“搜索”是个基本结构。web2.0的范式革命意义不仅呈现在微内容即信息生产上面,而且微内容伴随着信息组织方式的变革,相对应的信息组织方式提供了互联网更多的可能性,这就是我们要重点讨论的组织层。

组织层面的变革自身有几个不同的维度,比如tag之于catalog,xml之于html等。我们会看到,互联网的信息架构越来越强调开放性,不仅在内容组织上,tag相比catalog具有开放性,rss和xml让结构化的数据能够更好地被聚合和流通,开放API让网站内容之间可以强关联。当然,Trackback也是其中重要角色。

吃“组织”的饭

正是这种组织层面的变革,诞生了许多新网站。同时,专门的“组织”型网站批量诞生,比如为了实现blog这个主要微内容生产方式的信息获取、组织与呈现,仅以国内站点而言,zhuaxia、souyo、huolat、douban、bolaa、qihoo就在以不同的方式创造自己的“组织”与“呈现”方法——这些站点的核心都在于对blog内容的重新组织和再现(回头可专文讨论)。

国外有但是我们缺乏典型代表的,还有类似toptenblog或者9rules这样的,类似technorati这样的,类似techmeme这样的,类似ziki这样的。

吃“组织”层的饭有两种,一种是对信息价值链条真有贡献的:因为微内容的广泛性和信息爆炸,一些组织层站点能够很好的将内容进行关联、产生更好的互联网导航,帮助用户获取信息。还有一种是对信息价值链条有损害的:比如通过iFrame方式把内容框进来或者全文转帖的(copyleft内容除外),虽然也对解决信息导航问题有所促进,但是却对信息生产是负面力量——事实上,优质信息生产的保障将是未来互联网需要面对的一个重要问题。

插播一段:关于人

  • web2.0的范式革命在信息的角度就是信息生产和信息组织发生了变化,但是它不仅仅是在信息层面存在范式革命,而且对于整个web而言,这种范式转变还包括web2.0重新对待“人”,让人的关系变成了互联网的主要对象之一。将“信息”和“人”结合起来才会有更多的可能性,而这个目前不是本文重点,最后再来讨论。

Slashdot与digg

web2.0的典型站点很多,但是缺乏“人”这个维度更强调“信息”本身,而且具有典型意义的站点莫过于Slashdot与digg。

Slashdot能够脱颖而出,与众多媒体站点区别开来,有时候我们认为“社区性”是不可获取的,但这种“社区”与其它不同的在于它是基于“信息”产生的。Slashdot的最大特点是网站的所有读者都可以提交新闻,这样让信息来源变得广泛和及时;大量的新闻经由若干编辑即“把关人”的角色过滤后,来决定信息是否呈现以及按发布时间进行排序;新闻基本都会带来相当多的评论,而这些蔚为壮观的评论构成了信息的相关信息或者补充内容,使其更加完善。

这个模式本身是没有问题的,只是它的“优越性”不够,尤其是信息过多的今天,如何筛选信息变成了一个特殊需要解决的问题,所以digg出现了,它和slashdot的广泛提交、大众评论等十分相似,最大的变化是改变了“编辑把关”的思路,而将“把关”权力交给了读者——因为任何人都可以通过投票、评论再加上一个时间作为参数,读者可以决定新闻是否能够出现在首页被更多人看到,所以,这是个更理想的信息模式。

Digg.com具有某种唯一性,尤其在国内不可能得到成功的复制。但是Digg的原理在早期就在bbs有很多相关尝试。最关键的是,slashdot没有提供信息呈现方式的变革,而Digg提供了一个信息呈现方式的近乎范式价值的变革,也从而使得“大众投票”或者从“投票”加上其它“行为”计算,比如“收藏”、“评论”、“反对”等等参与行为,共同沟通了未来信息呈现的基本模型——这会被绝大部分有较多信息的站点参考。

所有站点的基本命题

“信息的生产、获取、组织与呈现”一直是所有站点的基本命题,但是是web2.0提供了更多的生产方式、获取方式、组织方式和呈现方式,才使得互联网的第二春显得蓬勃茂密得很。(关于一些站点在信息生产、获取、组织和呈现上的特点,在附篇会有一些个人意见分享)

(待续,谢绝转载和假“收藏”、“dig”方式的全文转载)

尽管Digg还处于风头尚劲的时候,但是相比mypaces、facebook、youtube,还有flickr、delicious,其价值相对较低,其中一个重要原因是,在Digg的架构里,其核心价值是信息的呈现方式,人与人的关系较为弱化——虽然Digg的信息呈现机制里面,群众的力量是关键的因素,但是人和人的关系并没有深度挖掘,信息无法在有关联的人之间进行更有针对性的流动。但是,在myspaces、facebook、youtube、flickr和delicious中,都存在因为“好友”的存在,使得信息能够在个体与个体之间进行流动——信息的定向流动使其与人的关联性更强,价值也就更好。

这恰好是web2.0的价值,即要创造一个社会性的网络,也就是说,“人”这个维度必须引入到信息的生产、获取、组织与呈现当中。

以个人为中心的信息组织
blog与bbs相比,blog是以“个人”为中心展开的,而bbs更强调“话题”即信息。这种区别导致了两种完全不同的产品,而那些认为“blog是个人bbs”的说法基本成为尘嚣了——不同的产品对不同价值的强调,使得看上去类似的东西却走向了完全不同的方向,因为它们对信息的生产、获取、组织和呈现的方式不同。

恰好是,让“个人”成为中心,这个人才能更好地成为信息的生产者、积极生产者、高质量生产者。

web2.0站点不仅在blog那里发现了个人,而且delicious也发现了文摘的个人、flickr发现了图片分享的个人、douban发现了阅读与评论的个人……在这样的web2.0站点中,你会发现,“个人页”是一个最为关键的页面,它取代了传统站点的首页与二、三级频道页成为新的核心信息组织、呈现的关键节点。

当你登录flickr以后,你应该看到你个人相关的信息、你朋友相关的信息包括图片以及参与的小组等,以及更好使用站点相关功能的直接链接,此外,你还会有一个专门的页面用于被朋友和他人查看。在douban和更多web2.0站点,这都是一个基本页面。你必须意识到,这是范式变革的重要表征。

信息围绕个人来组织、呈现

这存在一个反向的信息组织与呈现。你会发现,当你在一些web2.0站点,比如douban,系统会向你推荐一些信息,比如猜你会阅读的书籍或者是你朋友阅读的书籍或者和某本书有关的其它书籍,这个时候,系统会针对每个人来组织相适应的信息来对你进行个性化的信息呈现。

到现在,并不是所有的web2.0站点都完全针对个人来呈现特定信息,但是,都提供了良好的尺度,以围绕个人来呈现信息。blog的blogroll是一种主动打造的行为。Tags却是一个革命性的工具,它以一种独特的“聚合”、“关联”能力,为各种个体提供各种方向以及具备十足潜能的“磁针”来为信息提供指示方向。在delicious里面,你通过自己的tag找到用同种tag的更多信息,在flickr里面也是如此,technorati为代表的blog tag系统也是如此——Tag还有更多的价值,但是它为个体提供了特别的信息路径已经是不争的事实。

还有更多,比如Yahoo尝试将你的朋友的信息搜索结果作为优选推送,呈现在你的新搜索结果中,或者Google试图记忆你曾经的搜索记录来优化你的搜索体验——对于这一部分的讨论,我们还稍后还可以进行更多讨论。

用户行为与更好的信息呈现

digg所实现的信息呈现的价值,是建立在大量的用户行为之上的——这些用户行为,对于算法或者对于机器,对于计算,就是一种特殊的“信息”,它更好地帮助了解决不确定性。同样,delicious将网页地址当作信息。显然,还存在另外一种层次的“信息”,即它和人的行为、和普通意义上的信息的描述有关联。

看下面一张旧图

(可参考 web2.0info.ppt

在这张图里面,一篇blog post是与一组信息关联起来的(在今天,这种关联看上去要更多了),通过这些东西和一些专门的网站(这类站点也多了很多),又和更为广泛的信息关联,也就是说,对这篇信息的描述如果有这样一组信息作为关联,那它将会得到更好的解释——如果这能够纳入到算法体系里,成为搜索算法的优化方向,这意味着每个内容都拥有了一个语境和相关的人,每个人都有了一个颇大的信息群构成其语境,搜索将会基于被描述的语境来进行优化,这意味着准确性将得到飞跃性的提升,而且基于此,可以将一个人描述得相对完整。

主动以信息来描述自我

主动以信息来描述自我,将变成一个社会人、一个信息人的基本工作。blog、sns已经帮助我们描述一个自我,而你的“网络地盘”比如你的flickr、delicious、douban都在帮助将你自己描述得更清除,如果想降低社会交往的成本获得更好的社会资源,那么利用上述信息将自我描述得更为准确就成为一个社会人的基本工作。

而对douban、对google这种网站而言,主动贡献信息变成了你希望优化信息获取的必备条件——因为信息过爆导致少量的付出能带来极大的成本节约和绩效提高。很显然,在豆瓣里,你提供的已经或者希望阅读的书籍、电影越多,你就可能被系统越深入了解,你获得的推荐才可能越好;同样,你选取的“好友”跟你有越好的相近性或者互补性,你才可能从朋友的最近阅读里受益。

你的网络行为越多,你的收益越大,这是web2.0和不断进化的未来网络向你提供的许诺。

Yahoo和Google将如何死磕

从目前来看,Google更代表着未来,因为我们讨论过,跨平台地实现信息的获取、组织和呈现,搜集是基本手段。但是Yahoo并非没有机会,因为google在主导一个语义性网络的算法规则,而Yahoo有条件去创造一个语境网或者说社会性网络的算法规则,或许两者殊途同归走到一起,但是Yahoo并非没有底牌。

在过去一两年里,Yahoo收购了大量社区性站点比如delicious、flickr、upcoming等等,可惜它在较为纯粹的SNS方面还略有不足,另外对blog抓得不够紧,但无论如何,Yahoo拥有最好的Tag系统,而且它也发现了Tag的价值——在过去的一段时间里,Yahoo应该在持续地研究Tags能如何描述和架构互联网,并且,它的这些资产使得它能够在Tags的研究、描述和算法建模上拥有绝对的优势,而Tag绝对是社会性网络的核心要素之一。

上述资产不是封闭性的,拥有这些社区和用户并不意味着Yahoo能拥有未来,但是基于目前的条件,深入Tag,利用其在blog search、社区理解方面的探索,去研究语境搜索应该能帮助Yahoo去把握未来。我认为,和Google竞争,这是yahoo最大的机会,也许也是唯一的机会。

(暂完,但是这个主题还会写下去,可能还会有续~~~谢绝转载和假“收藏”、“dig”方式的全文转载)