数据挖掘-教育网志数据挖掘

来源:百度文库 编辑:神马文学网 时间:2024/04/27 20:48:05
先链点文章放在这里。关于web数据挖掘最常见一句是:
Web挖掘分为三类:
Web内容挖掘(Web Content Mining)
Web结构挖掘(Web Structure Mining)
Web用法挖掘(Web Usage Mining)
Web数据挖掘的研究现状及发展 : web数据挖掘 --- 数据挖掘研究院
Internet Computing-入门文章
Web Mining Researching:Survey
Web2.0系列软件发展,标志着与Blog相关联的各种新协议新标准新工具产生与被实践。Tim O’Reilly2005年力作《What Is Web 2.0》,阐述了下一代互联网络软件的设计模式与商业模式7方面规则,既是对Web2.0发展的阶段小结,又是对其未来展望与引领。另外从2004年开始由O‘Reilly公司与MediaLive国际公司组织年度Web2.0主题研讨会,是对基于Blog的Web2.0软件与服务发展的有力推进。
就名称而言,以Blog为代表的Web2.0系列软件被统称为社会性软件(Social Software)。对社会关系的研究是Blog与Web2.0发展中的重要内容。不同背景的研究者与实践者对社会关系研究探索的出发点也各不相同。有从技术角度对Blog相互链接社会关系进行统计与分类;有从社会心理研究Blog交往中人的行为;有从商业经济价值研究Blog商业发展服务模式等。
在这些研究中,对Blog相互链接社会关系进行数据统计与分类是基础。目前计算机领域Web数据挖掘技术发展,为从内容、从链接关系、从访问行为等角度研究Blog与Web2.0中社会关系提供了思路、方法、技术与工具支持。换言之,网志数据挖掘是Web数据的具体应用与发展之一。
就目前而言,Web数据挖掘技术在网志中的应用还处于起步阶段,如新近出现的http://performancing.com/,其中提供的统计数据还是一些通常数据,尽管如此,这也是网志应用向前发展一个巨大迈进。performancing.com对网志数据分析主要包括三方面统计数据:一是访问人群信息统计,主要包括新访问者与重复访问者的数据统计,具体信息还包括这些人群国家分布、语言分布等;二是访问行为统计分析,主要包括以单篇日志为单位的访问量分布统计、以日志分类为单位的分布统计、留言回复信息的分布统计等;三是对网志站点向外链接与来访站点分布的统计,还包括通过搜索引擎访问网志的信息分布统计等。
截取http://performancing.com/中本人网志一段统计数据,拼接如下图:

这是对日志内容不同类别被访问信息的分布统计。
Web数据挖掘技术在教育网志中应用,有不同于其在电子商务中应用的地方,每一个领域有其独特领域发展信息,Web数据挖掘技术在教育网志中的应用,将与教与学理论研究发展结伴而行。
_xyz