Builder.com.cn - Web技术 - Web 2.0和无上下文数据

来源:百度文库 编辑:神马文学网 时间:2024/04/27 23:47:47
Web 2.0网站的一个特点在于它们沉迷于核心数字提供的即时满足感。不幸的是,许多这种网站把一个原始数字误认为是有用的数据。
不是从“我如果让它进入并退出数据库”的角度,而是从“哪些数据有用,我如何显示它们”的角度。之前,我在博客中讨论了统计数据的显示问题,今天我再次讨论这个话题。
和以往一样,我的主要抱怨是这些网站习惯性地显示一个并不提供任何上下文的原始数字。例如,了解一下过去几年中建立的许多网站(包括这个网站)推出的典型“竖拇指”系统。个人来说,如果为选票提供合理的上下文,我认为这是一个不错的主意。
但事实并非如此。如果项目A有10张选票,而项目B有2张选票,那么项目A就优于项目B,是吗?不要这么快下结论。让我们进行第二次顺序统计,为它提供一个比较上下文。
我们用肯定选票的数量除以查看这个项目的人数,看看有多大比例的读者给出了肯定的评价。如果项目A有10000万名读者,而项目B有100名读者,那么根据阅读人数,则认为项目B比项目A更有价值。
进一步利用这个例子,我们进行第三次顺序统计。对,我们将增加更多上下文来澄清这个观点。在这个情况下,统计意义(与原始数字提供的“感觉良好”但错误的认知相对)上的第三个因素将考虑读者的人口统计和他们的投票记录。
如果对项目A投肯定选票的读者为他们阅读的每个项目都投的是肯定选票,那么我们应该扣除甚至是忽略他们的选票。
确实,与其它内容相比,许多内容分组有更多或更少的“坦白”读者。例如,似乎技术和政治是热情的“坦白”读者的“热门话题”(看看各种网站许多博客中按类别划分的焦点话题)。
将一篇政治博客文章与一个蛋糕食谱的选票数进行比较,即使二者的读者数相近,也没有多大意义。实际上,一些极为有用的信息(例如一组在线Linux指南手册),可能永不会有人评论或投选票,因为它根本不存在争议。
现在,在我们指出这些选票的意义前,我们考虑许多因素:选票数量、读者人数、投票人的投票记录、某个特殊项目类别的投票比率、甚至那些给那个特殊项目类别投票的投票人的投票记录。哟!Barbie说得对:“数学太难了!”如果没有至少利用前两个项目计算百分比,则“选票数量”明显是一个无用的数字。但Web 2.0里全部是这种情况。
具体说明这种情况:不与当地市场上出售的其它车辆进行比较,你会购买一辆二手小汽车吗?可能不会!当然,最初的标价非常重要(如果你根本买不起,它是不是一件便宜货都不重要),但如果你想买它,你就需要一个衡量标准。
确实,它的标价可能是一个警告信号。例如,通常,价格较低表明你应该仔细检查隐藏的问题。同样,如果你发现一幢漂亮住宅的价格极低,你就会担心邻居是否像看起来那样友好,或者两个街区外是否刚刚宣布了一个建设新监狱的计划。
确实,最有用的Web 2.0项目是那些为数据提供合理上下文的项目。这么多Web 2.0网站都使用地图是有原因的:要直观地显示某些数据,使用地图是一种特别有用的方法。
疾病发病率、收入比率、住房价格,几乎一切与地理位置有关的数字都可通过画地图的方式加强理解。地图一次性地完全两次顺序计算。明显的一个是比较在地理上接近的数据;另一个是比较地理位置本身。
气象地图就是一个典型的例子。结合许多不同的数据类型(云量、气温、降水量及地理位置),即使一个外行也很容易理解它们之间的相互关系。在这种情况下,地图即提供了上下文。
即使地图也可能没有多大用处。例如,显示三个国家的地图并不能显示杂货店的位置。另一方面,为100英里的行程提供一份街道级地图也没有多大帮助。另外,评估标准也非常重要。我经常发现地图的海拔显示错误,这也不能提供有益的比较信息。
虽然我认为Web 2.0提供日益显著的数据的趋势是件好事,但我仍建议你小心使用。最好是仔细规划数据,投入更多努力收集、计算和显示一个有益的统计结果,而不是在屏幕上堆积大量没有上下文的信息。