检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张民[1] 李生[1] 王海峰[1] 赵铁军[1] 王铁志
出 处:《情报学报》1996年第2期95-105,共11页Journal of the China Society for Scientific and Technical Information
摘 要:汉语自动分词是中文信息处理的首要工作。衡量一个分词系统性能优劣指标主要有两个,一个是切分的速度,一个是切分的精度。本文提出的基于知识评价的汉语自动分词算法,可大大提高系统的切分速度,而且利用基于复杂特征集的规则、模式等可处理掉大部分切分歧义。最后,本文对消歧提出了一些设想。Chinese automatic word segmentation is the first work in Chinese information processing.There are two factors in the evaluation of a Chinese word segmentation system,one is the speed of the segmentation,the other is the accuracy of the segmentation.In this paper,the structure of diction ary and the algorithm of a Chinese automatic word segmentation are presented,these approaches can increase the speed of word segmentation greatly,and can correct the greater part of segmentation ambiguity by using the rule based on complex features.In the end,some conceive plans are proposed.
分 类 号:G356.8[文化科学—情报学] TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7