检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖北大学数学与计算机科学学院,湖北武汉430062
出 处:《湖北大学学报(自然科学版)》2005年第4期331-335,共5页Journal of Hubei University:Natural Science
摘 要:对数据库受限汉语自然语言查询语句进行分词处理.分词算法分为两个部分,第一部分对最大匹配法进行改进,改进的核心思想是体现整句长词优先的原则,改进后的算法能够减少切分歧义;第二部分根据实例数据库的查询需要处理姓名和不稳定的属性值两类未登录词,未登录词的识别对后续句子的理解起着至关重要的作用.This paper describes the word segmentation of database natural language query based on restricted Chinese. The word segmentation algorithm is made up of two parts. The first part improves the maximum matching segmentation algorithm that fully embodies the principle of priority of long word on a whole sentence. The improved algorithm can decrease the ambiguity of segmentation. The second part processes two sort of unlisted words that are name and unstable property value according to the requirement of instance database. The recognition of unlisted words plays an important role in the following understanding to sentence.
关 键 词:受限汉语自然语占 分词算法 最大匹配法 长词优先 术登录词
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7