检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京航空航天大学软件学院,北京100191 [2]国际商业机器有限公司中国开发中心,北京100193
出 处:《计算机工程》2010年第6期1-4,共4页Computer Engineering
基 金:国家自然科学基金资助项目(10601029);北京市教育委员会共建基金资助项目(TS2047)
摘 要:设计描述通用文本处理逻辑的规则以及执行规则的引擎,使开发文本处理程序简化为开发应用规则。用XML描述规则的数据模型,规则元素包括原子规则、规则集、前置条件和数据上下文,在规则中用正则表达式实现文本匹配,用转义符和脚本语言实现多种转换逻辑。利用该方法进行Web主题文本提取,验证了规则的合理性和引擎的有效性。A rule is defined to describe the logic of text processing, and an engine is designed to execute the rule, with which text processing is simplified from programming to writing rule. A model of the rule is defined based on XML. The rule includes atom-rules, rule-sets, rule-applications and data contexts. The rule can match text with regular expression, and transform the matched results with escape character and script language. An experiment of extracting Web topic text is given to verify the rationality of the rule and the efficiency of the engine.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28