检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学技术大学计算机科学技术系,安徽合肥230027
出 处:《中国科学技术大学学报》2009年第11期1218-1223,共6页JUSTC
基 金:国家自然科学基金(60573077)资助
摘 要:以概念统计为基础,以WordNet为语义资源进行语义消歧和概念归并,提出了一种概念共现图模型并把它应用于多文档自动文摘.该模型利用概念间的共现信息构造概念共现图,抽取多文档集合的主题概念,再根据主题概念构建向量空间模型并计算句子的重要性.由于对概念进行了良好的归纳,该模型能够挖掘蕴涵在文档集中的深层次主题.在DUC2005数据集上评测的结果表明,该方法取得的效果令人满意,可用于实际的应用.A concept co-occurrence graph model was proposed and applied to automatic multi-document summarization. This model bases itself on the concept counting, disambiguating the different meanings of multi-sense words on the basis of the semantic resource -- WordNet and merging concepts. It constructs concept co-occurrence graphs and extracts subject concepts from the multi-document set by means of the co-occurrence information between concepts. Subsequently, it builds a vector space model and computes sentence importance in accordance with the subject concepts. As a result of generalizing the concepts well, this model is capable of digging out subjects hidden deep in the document set. Results from the DUC2005 evaluation indicate that the model of content co-occurrence graph can be put into practice.
关 键 词:WORDNET 概念统计 概念共现图 多文档文摘 自然语言处理
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.70