检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与应用》2004年第16期57-60,74,共5页Computer Engineering and Applications
基 金:国家自然科学基金项目资助(编号:60103022);"十五"重大科技攻关项目(编号:2001BA101A01);教育部优秀青年教师基金项目
摘 要:针对已有词类标注方法在标注网络答疑文本时存在的不足,文章提出了一种面向自然语言答疑文本的词类标注方法。该方法根据答疑文本的特点和后续关键信息提取的需要,对已有的词类标记集进行了扩展;用统计方法标注答疑真实文本,将其结果与正确结果相比较,从中获取词类排歧规则,使规则具有较强的文本针对性,以提高规则排歧的精度;对规则进行分类和优化,提高了标注的速度;采用先规则后统计的标注方法,较好地解决了答疑文本中规则和统计方法的组合问题。目前,该方法已在基于自然语言的网络答疑系统(NaturalLanguageOrientedWebAnswerSystem,,简称NL_WAS)中实现并得到了初步应用。Aiming at the shortcomings occur when the existing methods tagging the web answering text,this paper proposes an approach of part of speech(POS)tagging in answering text.This approach expands the POS tagging set based on the characteristic of answering text and the demand of key information distilling.After tagging the answering text by using the statistic_based method,the tagged result is compared with the right and corresponding one in the corpus,and from which the POS rules can be obtained.The rules acquired in this way can deal with the answering text more pertinently.Besides,classification and optimization to the rules can improve the tagging velocity.To solve the combination problem of rule_based method and statistic_based method,this paper adopts the method of rule_first and statistic_last.At present ,the approach above has been already realized and used in the Natural Language Oriented Web Answer System(NL_WAS).
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.187