检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广西工学院计算机学院,广西柳州545006 [2]广西工学院鹿山学院,广西柳州545616 [3]华中师范大学计算机学院,湖北武汉430079
出 处:《计算机应用与软件》2014年第9期40-44,共5页Computer Applications and Software
基 金:国家自然科学基金项目(90920005);广西教育厅项目(201106LX873)
摘 要:提出一种基于文本分割技术的多文档自动文摘方法。该方法使用HowNet作为概念获取工具,通过建立句子概念向量空间模型和利用改进的DotPlotting模型来进行文本分割。利用建立的句子概念向量空间模型计算句子重要度,并根据句子重要度、文本分割结果和文摘句相似度等因素产生文本摘要。使用ROUGE-N评测方法和F_Score作为评测指标对系统产生的文摘进行评测,结果显示使用文本分割技术进行多文档摘要是有效的。In this paper, we propose a multi-document auto-abstract method which is based on text segmentation technology. The method uses HowNet as the conceptual access tool, and segments the text through constructing the concept vector space model (CVSM) of sentence and using improved DotPlotting model. The CVSM of sentence is used to compute the importance degree of the sentences, and the text abstract is generated according to the factors of sentences importance degree, text segmentation result and the similarity of the sentences in abstract, etc. ROUGE-N evaluation method and F_Score are used as the evaluation index to evaluate the abstract formed by the system, the results show that to use text segmentation technology for multi-document abstract is effective.
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.217.244.16