西祠创始人重入互联网行业 正式推出爬狗网

来源:百度文库 编辑:神马文学网 时间:2024/05/02 10:06:46



本报记者 顾建兵 上海报道
蛰伏了近5年之后,陈辉民,这位西祠胡同的创始人再次踏入了互联网。
陈现在的职务是南京爬狗信息技术有限公司CEO,11月20日,经过两个月的测试后,他花费3年时间打造的爬狗网正式推出。
“跟Google等搜索引擎不同,我们的搜索信息是表格化的。”11月30日,陈辉民对记者表示,爬狗网是专门用来搜索分类信息的垂直搜索引擎,希望能结合全球最大的搜索引擎Google和全球最大分类广告网站Craigslist两者的优势。
然而,这个市场正在迅速升温,爬狗网刚一诞生就面对着无比强大的对手。Google和微软陆续宣布进入网络分类广告搜索市场。
11月16日,Google推出了酝酿已久的Google Base,用户可以在站点上提交各种在线或离线分类广告信息及图片,每一条信息获得唯一的标签,以便和他人共享各种分类信息。目前Google Base还在测试阶段,中文信息还不是很多。
微软也正在开发网络分类广告市场,并计划在接下来的几周内正式推出 “Fremont”服务,用户在上面可以卖、买或交换物品,并展示相关的信息,运营开支由搜索结果旁边的广告支持。
此外,美国一家本地分类广告搜索创业公司Oodle已经可以搜索到400万个分类广告。
垂直搜索机会
“垂直搜索引擎会是趋势。”陈辉民对记者说,Google、雅虎已经占领了通用型搜索引擎市场,这时候能够做的就是垂直的搜索引擎。在美国,博客搜索引擎Technorati目前已能搜索到2060万个博客;购物搜索引擎Shopzilla能够搜索到来自6万多个商家的近3000万件商品;而雅虎旗下的HotJobs则是专业化的求职搜索引擎。
陈辉民坦言,他之所以选择分类广告搜索,是因为看到了Craigslist在美国的惊人火爆。相关调查显示,在美国的很多大中城市,分类广告都是报纸第一大财源,而Craigslist使旧金山湾区的报纸每年损失近6500万美元的招聘和求职广告收入,以及数百万美元的商品和房地产广告收入。而在我国的北京、上海等大中城市,分类广告收入也占据着都市类报纸收入的很大份额。
2005年,eBay投资的分类广告网站客集齐在国内推出,在此前后国内涌现出唯客网、分类哥哥等数十家分类广告网站。“分类广告会逐步从报纸向网络转移。”激动集团股份有限公司副总裁胡志东告诉记者,胡目前负责管理激动集团投资的唯客网。
“爬狗要做的就是让用户轻松的搜索到这些网络分类广告信息。”陈辉民认为,就像当初美国西部的淘金热,“去分类广告业淘金的人太多了,我要做的就像是给淘金的人卖水。”
“我是有互联网情结的。”陈辉民说,1998年,22岁的陈同刘琥等三位伙伴在南京创办了后来人气颇旺的BBS社区——西祠胡同。
虽然西祠胡同当时相当火爆,但是并没有能够带来什么收入,这段时间,陈辉民等人只好依靠销售网吧计费软件来补贴网站,“当时比较迷茫,看不到前途”,陈回忆说。
1999年,陈辉民决定离开西祠胡同转而投向实业界,“我得去学会做‘真正’的生意”。一年多以后,西祠胡同以100万元现金加100万元股票的价格被E龙收购。同年,他把自己炒股赚来的60万元全部投入了一家珠宝公司,此后,在滚动发展中又介入了房地产和化学纤维领域。
2002年,陈辉民找了五六个技术高手开始了搜索引擎的研发,“当时感觉到国内的所谓门户,如新浪、搜狐只是大的ICP,他们将所有的用户指向自己的内容,而搜索引擎才是整个互联网的门户”,他认为未来搜索引擎必将取代门户的地位。
凭着多年的炒股经验,陈辉民感觉,互联网在经历了第一轮泡沫破裂之后,必然还会有一波复兴的行情,这时进入互联网业界并不算晚。靠着在传统产业的赢利,他在此后不断加大搜索引擎研究的投入,“大概投了300多万进去”。
但是在当时,陈辉民自己也并不知道要研发的搜索引擎最终到底会是什么样子,“只是探索性质的研究”。
现在,爬狗网的研发人员已经扩充到了40多个,“明年研发队伍要扩大一倍。”陈辉民说。
格式化表现
“爬狗的信息都是表格化输出的。”陈辉民对记者说,这是爬狗跟Google最大的不同之处。
第一代的搜索引擎,如早期的雅虎,所使用的搜寻方法是:网页建构人将自己的网站加入搜索引擎的资料库中,自行命名网站,并用几行文字描述该网站;在使用者键入搜索关键词后,搜索引擎会找出和搜索条件一样或相近的网站名字或描述。不过,第一代的搜索引擎最大的缺点就是无法针对网页内容进行搜索。
以Google为代表的第二代搜索引擎就不需要输入任何资料,而是由搜索引擎使用一个“Googlebot”的Spider(蜘蛛)程序,也就是俗称的“爬虫”,让这个“爬虫”在网络上自动抓取资料,并自动将取得的结果存入资料库中。
不过另外一个困惑也随之产生,Google的搜索引擎为网页搜索引擎,也就是说,使用者输入想要的关键词,Google会输出一堆网站链接,使用者再去链接到这些相关网站进一步寻找信息,这种方式一直延续到现在,这种搜索方式的麻烦之处在于搜索出的结果实在太多,查找起来很麻烦。
“我们的爬虫程序可以读完网页的全文,将使用者所需要的信息点从目标网站中提炼出来。”陈辉民告诉记者,爬狗由于应用了自有知识产权的格式化搜索技术,能把有用的信息直接从多个目标网站中提取出来,用表格化的形式提供给用户,用户在爬狗上输入想要的关键字,爬狗会输出一个链接,同时会输出一个表格,包含了用户想要的信息的各个方面。
实际上,由于爬狗已经帮助用户搜集整理了寻找到的信息列表,用户就不需要花费大量时间和精力在多个网站上去寻找,只要看表格的内容就可以知道是不是自己所需要的信息。
比如用户想要找一套房子,通常情况需要通过搜索引擎搜索到多个房产类网站,然后到每一个网站上去寻找合适的房子。而爬狗具有搜索比较功能,能够按照房型、面积、楼层、区位、价格等要素把符合要求的房子全部列举出来,方便了用户从中选择最合适的房子。
在陈辉民看来,爬狗网的格式化表现形式是能够同其他搜索引擎竞争的最大优势。
谁在拒绝爬狗?
“爬狗预计2007年上半年可以实现赢利,现在已经有广告收入进账了。”陈辉民对记者说,其中南京一家房产中介公司德奥置业以30万元购买了爬狗网南京房地产搜索频道一年的广告位,“明年估计广告收入可以达到千万元”。
“从明年1月份开始,爬狗将在全国招募广告代理商。”陈辉民透露,现在爬狗的渠道管理团队基本上已经组建完毕,预计到2006年9月,爬狗将在全国发展300家广告代理商。
同其他搜索引擎不同,由于爬狗的信息采用格式化输出,用户所要的基本信息在输出的时候已经被提了出来,“被提炼出来的信息表格通过手机屏幕就可以方便阅读”,陈辉民认为,这是做无线爬狗的机会,在国内,手机用户目前已经达到了3.5亿,而网民数量也不过1.1亿,如果能把爬狗网的无线版做成功,其用户数量基础可以扩大3倍多。
在陈辉民看来,用户搜索分类广告时需要的信息其实很简单,只要一些关键的信息就可以了,而手机就适合看这种比较短小的信息。
不过,随着在线分类广告市场的竞争加剧,在线分类广告网站是否会乖乖地和搜索合作呢?在国外,Craigslist于今年10月份拒绝了Oodle对它的信息进行搜索,同样的情形会不会出现在爬狗网身上?
陈辉民表示自己并不担心,他认为爬狗网的信息收录能给信息来源的在线分类广告网站带来流量,另外,与Craigslist拥有庞大的分类信息量不同,中国还没有哪一家在线分类广告网站的信息超过整体信息的5%,“所以就算有一两家拒绝被收录,也不影响爬狗网的效果”。
(责任编辑:romp)
_xyz