检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河南科技大学电子信息工程学院,河南洛阳471003
出 处:《计算机工程》2011年第16期206-208,211,共4页Computer Engineering
基 金:河南省科技攻关计划基金资助项目(102102210159)
摘 要:为提高计算机对汉语信息的处理能力,更好地进行浅层句法分析,提出一种基于最大熵的汉语短语结构识别方法。利用词语之间的互信息知识对句子的短语结构边界进行预测,应用最大熵模型建立原子模板与复合模板,选择有效的特征构成特征集,实现对句子短语结构的识别。实例证明,基于互信息的最大熵模型能取得较好的精确率和召回率。To improve the computer's processing capacity on Chinese information,and do better shallow parsing,this paper presents a recognition method of Chinese phrase structure based on Maximum Entropy(ME).The Mutual Information(MI) among the phrases is proposed to achieve boundary prediction of the sentences structure,and the ME model is used to set up atomic and composite templates,selects more effective features for constituting the final feature set.The identification of phrase structure is completed by using the ME method,and good precision and recall are proved in the ME model based on MI by the practical experiment.
关 键 词:浅层句法分析 互信息 边界预测 最大熵模型 特征选择
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.22.194.5