检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京林业大学信息学院信息管理系,北京100083
出 处:《计算机工程》2011年第20期261-263,共3页Computer Engineering
基 金:中央高校基本科研业务费专项基金资助项目"多元异构林产品信息推送平台研究与实践"(BLYX200928)
摘 要:根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用创建数据库和数据表匹配识别规则,给出识别规则匹配的正则表达式和文本内容截取识别规则,以抽取需要的特定事实信息,并以一种结构化的形式存储于数据库中。通过对实际林产品贸易网站的文本信息结构化抽取,证明该研究在林产品贸易信息推送中具有较好的应用价值。Based on the needs of structured storage of information in the forest products trade text messages information push and combined with the basic principle of semantic recognition and the rule-based information extraction,a research on forest products trade text messages structuring based on semantic is proposed.Took advantage of the characteristics of forest products trade text messages,this paper defines the level of text recognition rules in the trade text messages,uses match identification rules of creating databases and data tables,defines the regular expressions with matching identification rules and the rules of intercept text recognition to extract the special factual information.The information is stored in the database as a structured form.Through the text structured information extraction in the trade text messages,it proves that the research has good value in the forest products trade information push.
关 键 词:语义 林产品 贸易文本信息 结构化 信息抽取 识别规则
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112