检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:董慧[1] 余传明[1] 姜赢[1] 杨宁[1] 徐国虎[1] 张华[1]
出 处:《情报学报》2006年第4期451-461,共11页Journal of the China Society for Scientific and Technical Information
基 金:本文属国家自然科学基金资助项目(批准号:70373047)成果之一.
摘 要:语义信息提取是一项较新的技术,本文讨论语义信息提取的定义、原理和思路,并以国共两党关系历史为领域背景,详细分析语义信息提取的过程,即对于待处理的自然语言文字,将其进行分段和分句;针对拆分出的句子,进行分词和词性标注;在词性标注的基础上选择适当动词作为句子的语义谓词;判断该谓词是否属于语义谓词列表;再根据语义谓词来获取相关的语义实体,同时对于指示代词进行消解;最后对时间和地点维进行提取,并更新语义提取背景.本文还对开发过程中所用到的数据结构、关键算法进行了分析.Semantic information acquisition is an emerging technology. In this text, the author realized the GGHZ semantic information acquisition component with the steps below : splitting the paragraph into sentence, word tokenization and Part-of Speech tagging, selecting the semantic predict, selecting the semantic subject based on the semantic predict, selecting the semantic object based on the semantic predict, pronoun resolution, time correction and location correction and at last updating the semantic extraction context. The author provided the technical details in realizing the semantic information acquisition.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.139.239.109