基于语义的林产品贸易文本信息结构化研究  被引量:2

Research on Forest Products Trade Text Messages Structuring Based on Semantic

在线阅读下载全文

作  者:陈钊[1] 李嘉[1] 

机构地区:[1]北京林业大学信息学院信息管理系,北京100083

出  处:《计算机工程》2011年第20期261-263,共3页Computer Engineering

基  金:中央高校基本科研业务费专项基金资助项目"多元异构林产品信息推送平台研究与实践"(BLYX200928)

摘  要:根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用创建数据库和数据表匹配识别规则,给出识别规则匹配的正则表达式和文本内容截取识别规则,以抽取需要的特定事实信息,并以一种结构化的形式存储于数据库中。通过对实际林产品贸易网站的文本信息结构化抽取,证明该研究在林产品贸易信息推送中具有较好的应用价值。Based on the needs of structured storage of information in the forest products trade text messages information push and combined with the basic principle of semantic recognition and the rule-based information extraction,a research on forest products trade text messages structuring based on semantic is proposed.Took advantage of the characteristics of forest products trade text messages,this paper defines the level of text recognition rules in the trade text messages,uses match identification rules of creating databases and data tables,defines the regular expressions with matching identification rules and the rules of intercept text recognition to extract the special factual information.The information is stored in the database as a structured form.Through the text structured information extraction in the trade text messages,it proves that the research has good value in the forest products trade information push.

关 键 词:语义 林产品 贸易文本信息 结构化 信息抽取 识别规则 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象