ICTCLAS分词系统Java调用接口在Eclipse中的安装

来源:百度文库 编辑:神马文学网 时间:2024/04/30 12:04:36

ICTCLAS分词系统Java调用接口在Eclipse中的安装
(作者:刘利军 昆明理工大学 智能系统研究室)

实验环境:JDK1.5、Eclipse3.1、XP操作系统
分词系统Java接口解压包:d:\fenci(
http://www.nlp.org.cn中查找下载)
导入步骤:
在Eclipse中新建Java项目,名称为:WordSpli,目录结构如下所示: 

右击WordSplit项目,选择“导入”,将弹出导入窗口,选择列表中的“文件系统”,弹出“文件系统”导入窗口,选择相关文件(如下图所示):

(注:“选项”
里只能选择“只创建选择的文件夹”单选框。)
 选择完成后,单击“完成”按钮,反回Eclipse窗口,现在Eclipse包资源管理器中的目录应该是:

如果出上面的目录结构,恭喜你(运气不错),现在就可运行“ICTCLAS.java”文件(方法:右击“ICTCLAS.java”,选择“运行方式”中的“java应用程序”),并出现分词结果。
但在很多情况下会出现问题,例如经常出现:
java.lang.UnsatisfiedLinkError: no ICTCLAS in java.library.path
 at java.lang.ClassLoader.loadLibrary(Unknown Source)
 at java.lang.Runtime.loadLibrary0(Unknown Source)
 at java.lang.System.loadLibrary(Unknown Source)
 at com.xjt.nlp.word.ICTCLAS.(ICTCLAS.java:37)
Exception in thread "main"
的错误信息,出现这个错误的主要原因是Java项目的目录结构存在问题,Java找不到分词的动态库。如果出现上面的问题,你可能要花些时间整理其目录结构了,按照笔者的实验,可按下列步骤进行:
1. 新建Java应用(WordSplit),手工建WordSplit应用的目录结构(如下图所示):


 

本文以src(一般此目录在建立项目时会自动生成)目录为列说明如何创建:
方法:右击“WordSplit”应用,选择“新建”选项中的“源文件夹”,在弹出的新建源文件夹窗口中输入:src(如下图所示)后点击“完成”按钮,返回Eclipse环境。

2. 按照上述方法分别创建“classes”、“data”、“lib”源文件夹。
3. 分别导入相关文件夹中的文件及子文件夹,步骤如下:
       1. 导入src文件夹中的相关内容
       右击“src“,选择“导入”选项,弹出导入窗口,在列表中选择“文件系统”,按“下一步”按钮,选择src(解压包中)目录,如下图所示:

                                注:“选项”里只能选择“只创建选择的文件夹”单选框。
设置完成后,点击“完成”按键返回到Eclipse环境中,src中的内容将导入WordSplit应用中,出现如下目录结构说明导入正常:

2. 导入“data”目录中的内容
操作与上述过程相似,只是在选择文件时有所不同(如下图所示)

注:“选项”里只能选择“只创建选择的文件夹”单选框。
4. 导入“classes”文件夹中的内容
导入方法与上述方法相同,其实此文件夹的内容可以不导入,它是Java文件编译后生成class的存放目录,默认在bin目录中存放。
5. 导入“ICTCLAS.dll”,即分词动态库
右击“WordSplit”Java应用,选择“导入”?“文件系统”?选择“解压包”的根据目录,只选中“ICTCLAS.dll”文件即可(如下图所示):

注:选项里只能选择“只创建选择的文件夹”单选框。
此时ICTCLAS.dll文件将被添加到 “WordSplit”Java应用的根目录,到此为止就应该可以运行此应该了。
说明:由于Eclipse的环境的不同,可能会出现不情的错误情况,但总的来说,只要能正确配置目录结构及目录中的相关文件,就应该可以正常运行,主要的目录及文件包括:src、data、lib、ICTCLAS.dll(必须位于Java应用的根目录).

声明:转载请加入:http://blog.csdn.net/CloneIQ/archive/2006/07/20/945909.aspx
谢谢合作!