检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉理工大学计算机科学与技术学院,武汉430063
出 处:《计算机应用研究》2011年第5期1742-1744,1747,共4页Application Research of Computers
基 金:中央高校基本科研业务费专项资金资助项目(2010-IV-023)
摘 要:为了产生语义Web中的元数据,需要提取Web文档中的语义信息;面对海量的Web文档,自动语义标注相对人工和半自动的语义标注是可行的方法。提出的基于本体知识库的自动语义标注方法,旨在提高标注的质量。为识别出文档中的候选命名实体,设计了语义词典的逻辑结构,论述了以实体之间语义关联路径计算语义距离的方法;语义标注中的复杂问题是语义消歧,提出了基于最短路径的语义消歧方法和基于N-gram的语义消歧方法。针对构建的测试数据集,进行的标注实验表明该方法能够依据本体知识库,有效地对Web文档进行自动语义标注。To recognize candidate named entities,designed the semantic dictionary and calculated semantic distance between entities by semantic relevance path.The most complex problem in semantic annotation was semantic disambiguation.This paper proposed a semantic disambiguation method based on the shortest path and N-gram.Experiments was made on a news corpus.The result shows that the method is effective for the task of automatic semantic annotation.
关 键 词:语义标注 N-GRAM 语义消歧 有向图 知识库
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249