中文自然语言处理开放平台

来源:百度文库 编辑:神马文学网 时间:2024/04/28 11:52:36
首页 |资源 |项目 |帮助 |论坛
Search Documents Projects
 
用户(guest)
登录
我的档案
注册新用户
友情链接
ICT
NLP Group
GNU
Sourceforge
Language
Smpl.Chinese English
栏目 文档 显示全部 上载者 原作者
516items found All 网站帮助文档 网站新闻 项目说明 项目新闻 项目设计文档 论文 读书笔记 外部资源链接 文档 源代码 演示系统 工具软件 词典 语料库
[ Page123456789101112131415Next]
[词典]
带词性词频的扩展词典 词典 forever_apart
在北大信息词典范围之外的可用于大规模文本切分的扩展词典;含补充的基本词条(n,v...共约6万),含专有名词(nrt:译名,nrfg:姓+名,ns,nt...共约8万);不能直接加入ICTCLAS。希望给大家的研究工作带来一些帮助,也希望可以得到大家的意见!hoho
(126Downloads,2005-07-04)

2005年863中文信息处理与智能人机接口技术评测(机器翻译、语音识别、信息检索)
外部资源链接 liuqun
(2005-06-25)

[会议信息]
第二届全国信息检索与内容安全学术会议征文通知 文档 wangbin Wang Bin
信息检索、NLP、机器学习、数据挖掘研究领域的会议。。
(119Downloads,2005-06-23)

[信息检索和过滤]
Integrating Term Relationships into Language Models for Information Retrieval 文档 wangbin Nie Jianyun
加拿大蒙特利尔大学教授聂建云的报告,2005年6月22日在中科院计算所。非常精彩。
(70Downloads,2005-06-23)

我的博客:-)
外部资源链接 chinae
其中有一些我的关于NLP的一些文章, 我会经常更新的, 欢迎各种讨论和批评^_^
(2005-06-15)

[汉字编码]
《标注汉字表》 文档 laoli52 老李
标注汉字,是“汉语(汉字)的信息化表述“样式;不管你主观意愿如何,汉字存在一天,它的信息化表述问题就无法回避。这里的《标注汉字表》,是“标注汉字”的“读音偏旁归类检索序号”样式。图形文件。下载地址:《标注汉字》主页:http://bzhz.icpcn.com
(176Downloads,2005-05-19)

标注汉字
外部资源链接 laoli52
宣介国家通用语言文字的“信息化表述”样式;推广《语文输录法》系列方案;建议将汉字读音标注和输入编码融为一体;建议将拼音识字与汉字编码输入同步训练;建议将“语文基本属性”格式化,作为汉字编码输入的基础,希望以此实现汉字输入“万码归宗”,使汉字编码回归“语言文字”本源。《标注汉字》主页:http://bzhz.icpcn.com/
(2005-05-19)

标注汉字
外部资源链接 laoli52
《标注汉字》网,宣介国家通用语言文字的“信息化表述”样式;推广《语文输录法》系列方案;建议将汉字读音标注和输入编码融为一体;建议将拼音识字与汉字编码输入同步训练;建议将“语文基本属性”格式化,作为汉字编码输入的基础,希望以此实现汉字输入“万码归宗”,使汉字编码回归“语言文字”本源。《标注汉字》主页:http://bzhz.icpcn.com/
(2005-05-19)

中文文本分类语料库-TanCorpV1.0
外部资源链接 tansongbo
相比于国际上众多的英文分类语料库而言,本人深感中文分类语料库非常缺乏。因此,建立一个较具规模的中文语料库一直是本人的夙愿。但手工收集上万篇文本确实比较困难,因此收集工作进展较慢。直到最近才告一段落。 本语料库分为两个层次,收集文本14150篇。第一层为12个类别;第二层为60个类别。
(2005-05-18)

[语料库]
汉英对照古体诗词一百四十五首 语料库 liuqun 杨庆生
周锡令教授委托我上传的。作者是周锡令教授的中学老师,九十高龄的杨庆生先生。
(169Downloads,2005-05-18)

第一届中国分类技术及应用研讨会(CSCA 2005)
外部资源链接 still_zeng
会议宗旨 CSCA 2005 由中国计算机学会人工智能与模式识别专业委员会主办,由北京交通大学承办。分类是知识处理的基本问题。本次会议旨在推动分类技术研究及相关应用的发展,促进相关科技单位和个人的科技合作和学术交流,以及探讨分类与数据分析技术的研究与应用所面临的挑战性问题及关键性研究课题。 会议录用论文将由《计算机研究与发展》(正刊,增刊)正式出版, 会议还将评选大会优秀论文和研究生优秀论文。我们诚征有关分类和数据分析领域的最新创新性成果,包括分类和数据分析的原理、方法、算法以及特定领域的实际应用等。 征稿范围(不局限于下述范围) 分类技术基础理论:监督学习,半监督学习,聚类技术,PLS路径建模和分类,集成分类技术,多标签分类和Preference学习, 多事例分类,Multimode聚类和降维,差异性和聚类结构,分类和聚类算法复杂性 领域相关的分类和聚类技术:数据密集场景中的分类,文本分类和聚类,Web页面分类和聚类,时间序列的分类和聚类, 图像与视频检索, 计算机视觉中的分类,生物特征识别中的分类 分类技术应用:银行、金融、保险、市场营销、经济分析,商务智能,知识工程,目标识别,生物信息学、生物统计学,医药和健康科学,信息安全 投稿要求 1.论文应是未发表的研究成果,论文要求中文,采用word文件排版,论文请参照《计算机研究与发展》网页“作者须知”中的“最终修改稿要求”(http://crad.ict.ac.cn)书写,论文格式参考本刊2005年第1期执行. 2.会议论文采用网上提交方式,会议网址为:http://211.71.73.169/csca/,在提交论文的同时,必须提交一份投稿声明(从上述会议网站或者http://crad.ict.ac.cn网站下载),作者逐一签字后邮寄或传真到大会会务组,对不提交投稿声明的论文,会议将不予受理。
(2005-04-21)

2005年全国搜索引擎和网上信息挖掘学术研讨会
外部资源链接 still_zeng
全国搜索引擎和网上信息挖掘学术研讨会 (Symposium of Search Engine and Web Mining,以下简称SEWM) 是网络信息应用领域的重要活动,其目的是:促进国内外相关领域科研人员的学术和工作交流,研讨本领域的最新技术进展和发展趋势,以推动搜索引擎和Web挖掘技术在中国的发展。 SEWM 会议由中国计算机学会互联网专业委员会主办。会议已经举办两届,分别于2003年3月由北京大学、2004年11月由华南理工大学承办。第三届 SEWM 会议由清华大学承办,将于2005年9月26、27日在清华大学举行。 会议的主要内容包括主题发言、技术讲座、学术论文宣读和竞赛参赛队汇报。主题发言和技术讲座强调国际化,除了邀请微软亚洲研究院等本土涉外研究机构的专家以外,还拟约请国外专家到现场或做远程发言。学术论文经宣读后评出最佳学生论文奖。学术研讨会和信息搜索竞赛相结合是 SEWM 的重要传统,今年的信息搜索竞赛仍由北京大学主持。
(2005-04-21)

[词典]
网页统计词过滤 词典 forever_apart
由网页统计词过滤得到部分正确的高频词,和过滤噪音
(505Downloads,2005-04-09)

[词典]
基于网页的词频统计 词典 forever_apart
基于互联网网页的词语自动抽取统计结果, 因为大小限制,所以传上少部分结果, 希望对大家的研究有一点帮助
(16341Downloads,2005-04-08)

[会议信息]
第二届全国信息检索与内容安全学术会议征文通知 文档 wangbin
北京 中科院计算所 2005.10.计算机学报和计算机研究与发展给了5篇左右的名额。呵呵。
(391Downloads,2005-04-07)

[汉字编码]
手机中文输入的\"另类\"思考 文档 laoli52 老 李(《标注汉字》设计人)
手机中文输入的\"另类\"思考作者:老 李(《标注汉字》设计人) 2004/9/18 【摘 要】本文通过\"手机用什么输入中文?手机用多少汉字输入中文?手机如何\"个性化\"输入中文?如何选择手机\"个性化\"输入方案?\"等几个提问,对手机中文输入的一些基本问题,提出了\"另类\"思考。《标注汉字》认为:\"汉字输入编码\",是国家通用语言文字的一种信息化表述形式;应该用汉语的\"语文基本属性\",作为\"编制\"和\"使用\"汉字输入编码的依据;汉字输入编码,应该采用《汉语拼音方案》描述;汉字输入代码的称说,应该按照现有语言文字规范拼写或缩写;建立汉字输入编码\"通用模式\",作为各种编码方案相互联系、相互演化的依据,使\"万\‘码\‘归宗\",回归到\"语言文字\"这个本源。同时,还提出手机中文输入的用字\"减化\"方案;为手机中文输入\"个性化\",提供《语文输录法》系列(20类)选择方案。 【关键词】手机 中文输入 汉字编码 个性化 思考 标注 汉字 语文 输入法 减化 详细内容,请见《标注汉字》主页:http://bzhz.icpcn.com/ 上传时间:2005,3,26
(110Downloads,2005-03-26)

[会议信息]
Call For Papers IJCNLP-05 (October 11-13, 2005, Jeju Island, Korea) 文档 liuqun
(185Downloads,2005-03-18)

[会议信息]
全国第八届计算语言学联合学术会议(JSCL-2005)征文通知(2005年8月27日—29日南京) 文档 liuqun
(331Downloads,2005-03-18)

Ann Arbor: CoNLL-2005: Ninth Conference on Computational Natural Language Learning
外部资源链接 eleshock
(2005-01-29)

Switzerland: 3rd International Workshop on Generative Approaches to the Lexicon (GL2005
外部资源链接 eleshock
(2005-01-29)
_xyz