检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《情报理论与实践》2011年第12期15-19,共5页Information Studies:Theory & Application
基 金:国家自然科学基金项目"基于句子匹配分析的知识抽取研究与实现"的研究成果之一;项目编号:70803048
摘 要:设计了一种定义抽取系统,通过混合使用模式规则、语法规则和词频统计以达到定义抽取的目的。详细介绍了系统中的各项关键技术,包括分词技术、抽取规则导入技术、句子抽取技术和加权词处理技术。并选取《情报学报》2007—2008年的235篇论文全文作为实验数据,通过与人工抽取结果进行对比分析,测试了抽取系统的抽全率与抽准率。This paper designs a definition extraction system, which reaches the purpose of definition extraction by the mixed use of pattern rules, grammar rules and word frequency statistics. The paper gives a detailed description of the key technologies of the system, including word segmentation, extraction rules import, sentence extraction and weighted word processing. Taking the 235 articles published in the "Journal of The China Society for Scientific and Technical Information" from 2007 to 2008 as experimental data, the paper tests the recall and precision of the extraction system by comparison with the artificially extracted results.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7