检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华东师范大学商学院信息学系,上海200241
出 处:《现代图书情报技术》2013年第12期19-26,共8页New Technology of Library and Information Service
基 金:2011年度国家社会科学基金青年项目"联合虚拟参考咨询系统的知识库研究"(项目编号:11CTQ003)的研究成果之一
摘 要:基于领域本体提出一种适用于知识库树状结构的多层次文本聚类方法。该方法利用领域本体将词映射为各层级的概念,先以高层级的概念实现粗粒度聚类,以识别不同题材的文本,形成知识库的主体分类框架;再结合各层级的概念与未能映射的非概念特征词实现细粒度聚类,以揭示不同深度的文本主题信息,从而实现从粗粒度到细粒度的多层次聚类。The paper puts forward a kind of multi - level text clustering method for the tree structure of knowledge base. In this method, the words are mapped as concepts by the domain Ontology. First the texts are represented by the top - level concepts to realize the big - size clustering, identify the different subjects of texts and formulate the main classification framework. Then the texts are represented by all concepts and non - concept feature words to further realize the small - size clustering and reveal the subjects of the texts with different depth. Finally, this method realizes the multi - level text clustering from big size to small size.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.99