检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009
出 处:《微电子学与计算机》2015年第11期27-32,共6页Microelectronics & Computer
基 金:国家"八六三"高技术研究发展计划(2012AA011005);国家自然科学基金(61273292)
摘 要:中文问句中心词识别领域中,现有方法未能有效利用依存句法中的深层统计关系.为解决此问题并探究中心词在词的多维属性上的统计关系,首次提出多维树概念,给出多维频繁模式挖掘方案并应用于中文问句中心词识别中.针对此应用给出频繁子树模式精简及规则冲突解决方案,训练出一个中文中心词识别模型.此方法是典型的客观方法,实验表明,此方法有较好的稳定性、适应性与鲁棒性,且较条件随机场模型在准确率上有进一步提高.In the field of Chinese Focus-words Recognition,current studies don′t take full advantages of some deep statistical relationships in dependency syntax.To solve this problem and explore statistical relationships between Chinese focus words and the multiple properties of words,a new concept called Multi-Dimensional Tree(MDT)and a solution of mining frequent MDT pattern are proposed and applied.Solutions of condensing those frequent patterns and dealing with pattern conflicts are given,a Chinese focus words recognizer is trained.The method is a kind of typical objective method,the empirical results show that this method is good at stability,adaptability and robustness and can reach higher recognition accuracy rate than CRF model.
关 键 词:条件随机场 依存关系树 频繁子树模式 模式精简 规则冲突 中心词
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.44