基于WordNet的XML文档标记语义消歧研究  被引量:5

Word Sense Disambiguation of Tags in XML Documents Based on WordNet

在线阅读下载全文

作  者:潘有能[1] 滕海明[1] 

机构地区:[1]浙江大学公共管理学院信息资源管理系,浙江杭州310027

出  处:《情报科学》2014年第3期116-120,共5页Information Science

基  金:国家自然科学基金项目(70803046)

摘  要:XML文档中的标记是表达和控制文档内容的重要组成部分,但用户自行定义的标记往往存在语义歧义问题,对这些标记进行语义消歧是计算XML文档间语义相似度的前提,也是XML文档自动聚类和自动分类的基础。和传统的词典不同,WordNet中的词汇以树状层次结构排列,与XML文档解析后得到的标记树结构类似,为语义消歧提供了良好的、方便应用的工具。本文在阐述目前已有语义消歧算法的基础上,分析了基于WordNet的XML文档标记语义消歧的可行性,并详细说明了具体的流程。从实验结果可以看出,该方法能达到较高的语义消歧准确度。The tags are important to represent and control the content of XML documents, but it is com- mon that there is semantic ambiguity in user-defined tags. Word Sense Disambiguation is useful to calcu- late the semantic similarity of XML documents, and it' s also the foundation of XML document clustering and classification. Differ from traditional dictionaries, WordNet arranges the words with hierarchical struc- ture like a tree and provides advantage to Word Sense Disambiguation~ The paper introduces the existing algorithms of Word Sense Disambiguation, then analyzes the possibility of word sense disambiguation of XML documents tags based on WordNet, and explains the procedures in detail. The experimental result proves that this method has a high accuracy rate in Word Sense Disambiguation.

关 键 词:XML文档 语义消歧 WORDNET 

分 类 号:G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象