文献信息检索22

来源:百度文库 编辑:神马文学网 时间:2024/04/29 16:09:00

2.1 命令检索
命令检索用于联机检索系统,应用于许多Web版数据库的检索。检索式由若干检索词组配形成。这些检索词的扩展、限定的字段,它们之间的逻辑关系、位置关系等均可由算符的连接来表示。尽管不同的联机系统有各自定义的算符表示,命令形式不尽相同,但都有许多一致的检索功能。以下用国际上比较最成熟的美国Dialog联机检索系统的命令方式为例来讨论命令检索基础。
常用算符
算符(operator)即组配符,它们与检索词互联组成检索式,表达检索策略。常用的算符有:截词符、检索字段符、逻辑算符、位置算符等。
(1) 截词符
截词符(truncation operator),也称统配符(wild card), 用来对检索词(干)进行扩展。在Dialog系统中用 ? 号表示。?号加在不完整的词或词干之后,或是插在一个词的中间来表示词后或词中可添加的随机字符。其作用是减少检索词的输入而保证相关检索概念的涵盖,同时也方便解决语言文字拼写方面的差异(如美式英语和英式英语),避免漏检。截词有:非限定性截词、限定性截词和中间截词等。
非限定性截词
截词符(truncation operator),是在一个词尾加一个 ? 号,表示在其后可添加任意多个字符,这些字符都被作为检索词进行检索。
如:smok?
它将对若干词进行检索,包括:smoke, smoky, smoked, smoker, smokes, smokers, smoking, smokeless等等。
限定性截词
限定性截词(limited truncation), 是在一个词尾加有限个 ?号,n个 ?号表示其后可添加的字符数少于等于n个。
如:smok??
将对smoke, smoky, smoked, smoker, smokes等进行检索。对于最多允许添加一个字符的情况, 则用 ? ? 的形式表示。
如;smok? ?
将只对 smoke, smoky进行检索。
中间截词
中间截词(embedded truncation), 是在一词中间出现若干个?号,表示可插入若干个字符。
如:ioni?ation
它将对ionisation和ionization进行检索。
如:cent??line
它将对centerline和centreline进行检索。
_xyz