易知软件,写意生活 - 文本挖掘系统的初步设想

来源:百度文库 编辑:神马文学网 时间:2024/04/30 03:16:42
文本挖掘系统的初步设想
Submitted by山人部落 on 2005, September 25, 7:10 PM.技术分析
文本挖掘系统,主要基于:中文分词,SVM分类器,专业词库识别器等模块。
文本挖掘系统的初步版本,主要实现以下功能:
1.文章推荐功能。根据用户当前阅读的文章,自动推荐系统中相类似的现有文章。
2.交互式的分类归档功能。允许用户设定分类,并由系统自动地将文章归到不同的类别中;并且可以接收用户的反馈和参数重新设定,进而进行下一次自动分类,这一过程可持续到用户满意为止;后续加入的文章,可以自动根据现有的分类数据归类到一个分类中。
3.热点推荐功能。可以为用户提供统计图表,显示信息当前热点,热点变化趋势等等。
4.所有操作以实现图形、可视化的方式,为最佳选择。
在实现文本挖掘系统时,采用文档向量表示法,采用欧式算法来计算两个文档的相似度,基于统计原理细化分类结果。