检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]云南省计算机技术应用重点实验室,昆明650500 [3]昆明理工大学质量发展研究院,昆明650093
出 处:《计算机工程与应用》2012年第20期177-181,210,共6页Computer Engineering and Applications
基 金:国家自然科学基金(No.60703116;No.61063006);云南省教育厅科学研究基金重点项目(No.2010Z017)
摘 要:基于XML树的匹配已被广泛应用于数据挖掘、自然语言自处理、图像检索等领域。通过分析现有的基于XML树的匹配度计算方法,发现存在对计算的前期要求(如权值分割)太过严格、匹配度结果存在误差等问题,影响了匹配的精度和效率。基于XML的内容约束和结构约束,综合结点相似度和层次相似度,提出一种结构相似度计算公式,改进了匹配计算结果的准确度,并通过实验验证了公式的有效性。Tree matching based on XML has been widely used in many domains, including data mining, natural language processing, image retrieval and etc. The existing tree matching calculation methods based on XML are studied. There are some problems that founded in the existing method of matching calculation, such as strict requirement before calculation(weight division), errors in the result of matching, which will affect the matching accuracy and efficiency. In order to resolve the existing problems in formula and achieve better matching results, this paper computes the node similarity and the level similarity based on the constraints of content and structural of XML. A formula of the structural similarity is presented, which can improve the accuracy of matching results. The validity of the formula is proved through experiments.
关 键 词:可扩展标示语言(XML) 树匹配 相似度计算
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.55