检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西南民族大学计算机科学与技术学院,成都610041 [2]西南财经大学经济信息工程学院,成都610065
出 处:《计算机科学》2006年第7期204-206,共3页Computer Science
基 金:四川省重点科技攻关项目(05SG022-016);西南民族大学自然科学研究项目(05NY003)
摘 要:提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系统,并提出了分词策略。对汉语切分中的歧义问题进行了深入的探讨,应用互信息和t-信息差完成了消歧算法的设计。实验表明,该系统具有较高的切分正确率与效率。It is a trend that MIS provide a Chinese indexing interface,its main difficulty is how to let the computer comprehend Chinese In this paper we set up a word segmentation system of Chinese intelligent indexing interface and propose its word segmentation strategy. After disussing the ambiguity problems of Chinses word segmentation, we give a diambiguity alogrithem based on mutual information and difference t-test. The experimental results show that it has a high segmentation accuracy rate and efficiency.
关 键 词:MIS 自动分词 切分歧义 交集型歧义 组合型歧义
分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.140.250.157