基于概率信息抽取模型的Top-k查询  

Probabilistic Information Extraction Model Based Top-k Queries

在线阅读下载全文

作  者:何明[1] 李薇[2] 

机构地区:[1]北京工业大学计算机学院,北京100124 [2]中国工商银行股份有限公司北京市分行信息科技部,北京100088

出  处:《计算机研究与发展》2011年第S3期224-231,共8页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60803086);北京市教育委员会科技计划面上项目(200910005009;20110005013)

摘  要:随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.随着数据采集和处理技术的进步,在经济、军事、物流、金融、电信等领域的具体应用中,数据的不确定性普遍存在.不确定性数据的表现形式多种多样,它们可以以关系型数据、半结构化数据、流数据或移动对象数据等形式出现.针对信息抽取过程中的不确定性数据,基于半条件随机场(semi-Markov Conditional Random Fields,semi-CRFs)模型,构建支持不确定数据Top-k查询的信息抽取框架.建立基于关系的不确定性数据描述方法和存储模式,提出一种基于概率框架下的面向不确定性数据的Top-k查询算法.实验证明,该框架在提高数据元素属性标注性能的同时,在Top-k查询方面也具有有效的查询响应性能.

关 键 词:信息抽取 不确定性数据 概率数据库 条件随机场 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象