频繁子树模式在中心词识别中的应用研究  被引量:1

Study on the Application of Frequent Sub-tree Patterns in Focus Words Recognition

在线阅读下载全文

作  者:田卫东[1] 黄勇[1] 

机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009

出  处:《微电子学与计算机》2015年第11期27-32,共6页Microelectronics & Computer

基  金:国家"八六三"高技术研究发展计划(2012AA011005);国家自然科学基金(61273292)

摘  要:中文问句中心词识别领域中,现有方法未能有效利用依存句法中的深层统计关系.为解决此问题并探究中心词在词的多维属性上的统计关系,首次提出多维树概念,给出多维频繁模式挖掘方案并应用于中文问句中心词识别中.针对此应用给出频繁子树模式精简及规则冲突解决方案,训练出一个中文中心词识别模型.此方法是典型的客观方法,实验表明,此方法有较好的稳定性、适应性与鲁棒性,且较条件随机场模型在准确率上有进一步提高.In the field of Chinese Focus-words Recognition,current studies don′t take full advantages of some deep statistical relationships in dependency syntax.To solve this problem and explore statistical relationships between Chinese focus words and the multiple properties of words,a new concept called Multi-Dimensional Tree(MDT)and a solution of mining frequent MDT pattern are proposed and applied.Solutions of condensing those frequent patterns and dealing with pattern conflicts are given,a Chinese focus words recognizer is trained.The method is a kind of typical objective method,the empirical results show that this method is good at stability,adaptability and robustness and can reach higher recognition accuracy rate than CRF model.

关 键 词:条件随机场 依存关系树 频繁子树模式 模式精简 规则冲突 中心词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象