检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海交通大学计算机科学与工程系,上海200240
出 处:《计算机工程与应用》2009年第5期138-140,188,共4页Computer Engineering and Applications
基 金:国家自然科学基金资助重大项目(No.60496326)~~
摘 要:获取概念的属性信息有助于构建概念间的关系,进而改进基于概念的信息检索等应用的性能。研究了如何从机器可读词典中获取释义项的属性信息并实现了一个相应的系统DAE(Dictionary Attribute Extractor)。系统基于bootstrapping思想,进行模板-元组迭代抽取。在模板的获取中,引入了基于生物信息学多序列比对的方法;模板泛化时,引入词汇语义相似度计算和同义词扩展,提高模板覆盖率。实验中,系统抽取了"功能"、"颜色"和"组成"三种属性,取得了较好的效果。Acquisition of the attribute information of concepts can help in constructing relationships among them and further improving performance of applications such as information retrieval based on concept.This paper addresses on how to extract attribute information from a machine readable dictionary.A system named DAE(Dictionary Attribute Extractor) is also implemented. DAE,which is based on bootstrapping,extracts patterns and tuples iteratively.In extraction of patterns,it makes use of sequence alignment of bioinformaties.When generalizing patterns,semantic similarity of words and synonym extension are used to make the patterns more selective.In experiment,the system extracts attributes of functionality,color and composition which give good results.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.147.75.131