检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:石义金[1] 王忠义[1] 沈雪莹 郑鑫 Shi Yijin
机构地区:[1]华中师范大学信息管理学院,湖北武汉430079
出 处:《情报理论与实践》2020年第11期144-149,共6页Information Studies:Theory & Application
基 金:华中师范大学中央高校基本科研业务费项目“数字馆藏资源多粒度层级结构挖掘研究”的成果之一,项目编号:CCNU19TS043。
摘 要:为提高科技文献中各类型知识元抽取的效率,提出一种基于序列模式的科技文献知识元抽取模型。该方法首先在各类型知识元描述规则的基础上,对知识元语句进行依存句法分析,生成融入语义的知识元序列模式;其次,基于知识元序列模式,通过模式匹配算法实现各类型知识元的抽取;最后,基于Prefixspan算法,从抽取的知识元中挖掘出新的描述知识元的序列模式,以实现知识元序列模式的不断动态更新与扩展,进而依据知识元序列模式提高知识元的抽取效率。基于序列模式的科技文献中知识元的抽取方法,克服了基于规则匹配的语义局限,具有学科延展性,提高了知识元抽取的效率。In order to improve the efficiency of the extraction of various types of knowledge elements(KEs)in the scientific literature.This paper proposes a knowledge model extraction model based on sequential patterns.Firstly,based on the description rules of each type of KEs,the KEs sentence is analyzed by dependency parsing,and to generate the semantic integrated KEs sequence pattern.Then,based on the KEs sequence pattern,each type of knowledge element is extracted by pattern matching algorithm.Finally,we use the Prefixspan algorithm to mining new new sequence pattern describing the KEs from the extracted KEs,and to realize the continuous dynamic update and expansion of the KEs sequence pattern,and then improve the knowledge element extraction efficiency.The method of extracting KEs in the scientific literature based on sequential patterns overcomes the semantic limitations based on rules matching,has discipline extensibility,and improves the efficiency of KEs extraction.
关 键 词:科技文献 序列模式 知识元 知识元抽取 依存句法 PREFIXSPAN
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7