文本信息深度提取及多关键词并行匹配技术研究  被引量:2

Research on Text Information Depth Extraction and Multi-keyword Parallel Matching Technique

在线阅读下载全文

作  者:王文奇 李勇[2] 关云云[3] WANG Wenqi;LI Yong;GUAN Yunyun(Zhengzhou Key Lab of Computer Network Security Assessment,Henan Engineering Lab of Computer Information System Security Assessment,Zhengzhou 450007,China;School of Physics and Electrical Engineering,Anyang Normal University,Anyang,Henan 455002,China;Library,Zhongyuan University of Technology,Zhengzhou 450007,China)

机构地区:[1]计算机信息系统安全评估河南省工程实验室郑州市计算机网络安全评估重点实验室,郑州450007 [2]安阳师范学院物理与电气工程学院,河南安阳455002 [3]中原工学院图书馆,郑州450007

出  处:《计算机工程》2018年第12期281-287,共7页Computer Engineering

基  金:河南省科技攻关项目(142102310284)

摘  要:目前文本信息提取与检索无法适应复杂环境、受用户权限限制以及面临存储器容量大的问题。为此,通过对各种文档文本信息的特征分析,建立基于并行的深度文本信息分析系统。基于XML细粒度表达的不同类型文档提取文本信息,采用基于多核的并行技术根据关键词检索分析提取的文本信息,最后输出信息分析结果。实验结果表明,该系统能够细粒度地深入分析不同类型文本信息,在检索词数量较多时,可以快速提取完整信息。At present,text information extraction and retrieval cannot adapt to the complex environment,limited by user rights and facing the problem of large storage capacity.Based on the feature analysis of all kinds of document text information,a parallel depth text information analysis system is established.Text information is extracted from different types of documents based on fine-grained expression of XML,and the text information extracted by keyword retrieval is retrieved by parallel technology based on multi-core.Finally,the result of information analysis is outputted.The experimental results show that the system can analyze the different types of text information in fine granularity and extract the complete information quickly when the number of keywords is large.

关 键 词:XML细粒度表达 磁盘信息提取 文档文本信息提取 内存管理算法 并行搜索算法 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象