检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国农业科学院农业信息研究所 [2]中国农业科学院农业部农业信息服务技术重点实验室
出 处:《图书情报工作》2014年第5期93-97,共5页Library and Information Service
摘 要:针对中文自动标引过程中经常会产生诸多歧义词,导致检出的信息不切题或漏检这一问题,在论述自动标引中歧义词消除方法的相关研究基础上,提出一种将穷举法和消歧规则相结合的歧义词消除方法。测试结果表明,这是一种行之有效的消除歧义词的方法。To achieve precise retrieval of massive information in network environment, firstly it is necessary to ensure that there are no ambiguous words in the literature indexing words. A lot of ambiguous words often are pro- duced in Chinese automatic indexing process, and leads to retrieving irrelevant or missed information. This paper fo- cuses on the related research on methods of eliminating the crossed meanings ambiguous words in the automatic inde- xing and puts forward a method to eliminating ambiguous words combined algorithm of exhaustive method and disam- biguation rules. Experiments show that the method can avoid a great lot segmenting ambiguities with better segmen- ting results.
关 键 词:中文文本 自动标引 关键词提取 歧义词消除 算法研究
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145