豆瓣的真相

来源:百度文库 编辑:神马文学网 时间:2024/04/27 20:37:33
一、研究原因
05年10月,当时豆瓣网上线半年左右,我还在天涯社区负责产品方面的工作。有一次,在和某家著名VC的投资经理沟通时,我们谈到天涯的潜在竞争对手。我告诉他不是mop,而是豆瓣。他对我的答案略感吃惊。
我从不认为mop是天涯的竞争对手――去年我是天涯员工的时候,我这么说;现在我不是天涯的员工,我还是这么说。业界,尤其是媒体界对mop的估计,几乎从来没有用数字说话,远远过于乐观。事实上,Mop这个网站,在陈一舟没有收购之前,只相当于天涯主版的两、三个版面,(参考我在去年5月的文章《Mop的一些数据分析》),而天涯仅主版就有50多个版面;在陈一舟收购之后的mop,怎么说呢?呵呵,今天天气呵呵呵。
但豆瓣,虽然在05年10月刚刚上线半年,其流量远远不能和天涯相比,但不过我当时作为天涯员工,就已经把它视为最主要竞争对手。由此可见我对豆瓣一直非常关注。07年1月,在后来业界广泛流传的《谢文、keso、麦田新年对话:社区2007》一文中,我依旧对豆瓣看好,但同时我认为豆瓣存在“结构性”的问题。
关于这个问题,去年我写的《豆瓣的力量》和《社区:规模及“体用合一”》都有所涉及。事实上,我写这些文章,都在试图解释一个现象:为什么豆瓣在05年增长那么迅速,而06年增长那么平缓?而我把这归结于豆瓣自身的“结构”问题。
但老实说,这个答案只给出了部分解释。我内心总认为还有别的原因造就了豆瓣05年和06年的反差。但那又是什么呢?
在“社区研究”新任主持人思践的建议下,社区研究的五位主持人何田、固若GinTonic、思践、hilaa和我成立了“一厘米社区学习小组”,定期发表一份五人研究报告,每期报告会从多个角度,分析同一个网站,以此希望以务实、细节的态度,对中文互联网网站社区运营经验进行分析、总结和提炼,为业界朋友实务操作提供参考。作为这个研究小组的第一期报告,我们选定的研究对象是豆瓣网。
昨天,在完成这个研究作业的过程中,我又仔细分析了豆瓣。没想到,曾经长期困扰我的豆瓣“05年快速增长和06年平稳增长”之谜,让我自己给解开了。或者说,也许我看到了豆瓣的真相。
二、豆瓣的流量和服务
先说豆瓣的流量。从alexa曲线上,再根据我的经验,豆瓣现在每日独立IP可能在20万左右,PV在150万左右。也许有人会觉得这个流量不大,但作为一个才做了两年的网站,豆瓣的流量实际上相当不错――因为它不是来源于“买”的流量,而都是豆瓣服务所带来的“货真价实”的流量。
再说豆瓣的服务。简要将豆瓣的服务构成概况如下表:
服务类别
独创特色服务
社区服务
SNS服务
衍生服务
项目
读书/音乐/电影
小组(group)
友邻
九点
在上述项目中,豆瓣的“独创特色服务”最为重要,它是豆瓣之所以为豆瓣的关键服务。那么,用户是如何使用豆瓣的“独创特色服务”的呢?对于这个问题,我问过周围一些人,大家基本上都是这样的:我看了一本书(电影/音乐),或者我想买一本书(电影/音乐),我就会去豆瓣上看一看。
这些朋友的回答,和我自己对豆瓣的使用情况完全一致。此外,由于我本人多年的网络经验恰好在“读书”相关社区,我对网络上“读书人”群体比较了解,这也使得我相信,多数网络“读书人”就是这么使用豆瓣的特色服务。
现在有很多业界的朋友认为豆瓣的特色服务做的好,特别是“算法”和“用户行为分析”这两个方面。但我恰恰不同意这种观点:一方面,我也认为豆瓣在“算法”和“用户行为分析”做了很多创新,做的相当不错;另一方面,我认为他们在做这方面的工作时候,忽略了“互动”这个更关键因素。简而言之,对于产品设计,我从来都认为――“算法”做的好,不如“互动”做的好。
大家也许不同意我的产品设计观点。没关系,我的重点其实是想说,根据我的经验,目前豆瓣的“读书音乐电影”特色服务产品设计,应该不能支撑目前150万pv的流量。
三、豆瓣的小组(group)
豆瓣的流量,我分析,大多数可能来源于――“小组”(group)。
先简单说说豆瓣小组的情况。目前豆瓣全部小组的总数是25851个,小组的订阅人数分布如下:

对于上述分布,奇迹笔记的xba网友有非常精辟的论述。在其文《豆瓣的小组,也不是长尾分布》中,他谈到:“我把15人以下的小组,共19000多小组,的总人数全加了一遍,总共只有6万多人(次)。而如果我们把前500个小组(人数500以上的)的小组总人数相加已经到了60多万。这是一个比28分布还陡峭的曲线,后80%的小组,只是前2%(还不是百分之20%)的小组人数的1/10。如果算前20%小组的话,估计能达到总人数的99%”
那么,豆瓣“头部”的小组到底有多“强大”呢?我昨天把豆瓣排名第一的“爱看电影”小组分析了一下:该组创建时间差不多700天,总发主贴6500多,基本可以看作每天主贴10篇。我又统计了最新200篇更新主贴和中间的200篇主贴,发现“爱看电影”的用户回复率相当高,最新200篇回复率是30,而中间200篇回复率是20。
对我来说,这是一个重要的发现,数据让我豁然开朗:豆瓣的一个“强大”的组,已经可以媲美大型社区的一个版块的流量――比如“爱看电影”的发贴回复合计,应该已经达到天涯主版中的“影视评论”的1/5。
而这,仅仅是豆瓣的一个组!
由于我非常了解天涯的流量。因此,通过“爱看电影”这个小组,我从天涯的流量反推估算出豆瓣小组的流量,再比较豆瓣总流量的150pv。我的推论是:豆瓣这150万pv的流量,大量来源于group。而具体流量数据,我估计豆瓣小组有100万左右pv,即豆瓣小组的流量占据全站70%以上――并且,这部分流量严格遵循传统的28原则,主要由25000多个小组中“头部”的240个小组贡献。(订阅人数过1000人的小组)。
需要特别说明的是,豆瓣的小组,整体上看和阅读/电影/音乐关系不大,而是一个“文化生活”全方面的小组。比如,讨论美食,化妆话题等等,都是热门小组。而豆瓣小组讨论,其实和任何贴吧或bbs都无区别――大致围绕着某个主题,闲聊。
四、谁在上豆瓣
关于这个问题,豆瓣曾经做过一次调查,其调查结果揭示出两点:
1.豆瓣80%的用户在26岁以下,90%的用户在30岁以下――这意味着豆瓣用户比中文互联网用户平均水平更年轻
2.豆瓣用户50%是学生,23%是公司职员,从中可以看出豆瓣的用户学历普遍水平,远远高于中文互联网用户平均水平
结论:年轻、高学历用户是豆瓣的主要用户
五、豆瓣的真相
如果百度贴吧的流量占据百度全站的70%,我们还会认为百度是一个“搜索网站”吗?豆瓣亦是如此。事实上,豆瓣其实和图书关系不大,用户行为使得豆瓣实际上成为了一个group为主的社区网站。通俗点说,豆瓣就是贴吧,只是用户平均学历更高。
而这就完全能解释豆瓣“05年快速成长VS.06年平稳增长”之谜。在05年,阿北反复考虑精心设计各种算法,而推出的“读书音乐电影”等等特色服务,对于网民来说,起到的作用并不是服务本身多么有用,而是服务所透露的“高雅格调”。这种高雅格调,尤其吸引年轻的大学生――想想我们自己年轻的时候吧,越是没有钱,不越是讲究高雅小资吗?因此,05年,豆瓣成为年轻大学生的“时尚”,而大学生群体具有高强度的口碑传播力,所以豆瓣快速发展。大学生和业界,是05年豆瓣发展的主要推动力。
但大学生们到了豆瓣,如上,开始扎堆,闲聊。不需要多少产品设计,有个group就成,阿北的各种“算法”其实早就不是他们的重点。而阿北呢,还在继续优化他的产品,对各种算法予以精心考虑。在豆瓣上,用户需要的,和阿北给予的,产生了背离。同样在这个时候,05年的“时尚”也褪去了,产品推动力又出不来(因为用户压根没怎么使用豆瓣的产品―除了group),豆瓣找不到下一个推动力,因此06年的豆瓣发展平缓。
如同木子美拯救了blogcn和blogchina;如同竹影青瞳拯救了天涯;如同超女拯救了百度贴吧;如同徐静蕾拯救了新浪博客;如同张钰拯救了优酷;如同每一个伟大的网站背后都有一个女人。同样的,蛰伏的豆瓣也在等待它背后的那个女人,而不是在等待――阿北的算法。
无论是否高低学历,年轻的中文网络用户在目标网站上都只做了一件事――扎堆、闲聊。从天涯,到百度,到豆瓣,中国网民在任何一个交互网站上,都做着同一件事――扎堆、闲聊。
这是最后的真相。