一种主题句发现的中文自动文摘研究  被引量:8

Chinese Automatic Summarization Based on Thematic Sentence Discovery

在线阅读下载全文

作  者:王萌[1] 李春贵[1] 唐培和[1] 王晓荣[2] 

机构地区:[1]广西工学院计算机工程系,柳州545006 [2]华中师范大学计算机科学系,武汉430079

出  处:《计算机工程》2007年第8期180-181,189,共3页Computer Engineering

基  金:广西科学基金资助项目(桂科自0481016);2006年度广西教育厅科研资助项目(149);广西工学院博士基金资助项目

摘  要:提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。Automatic summarization is one of main research fields in natural language processing. This paper proposes a special Chinese automatic summarization method based on discovering thematic sentences, which uses terms as minimal semantic unit rather than word, and employs term length term frequency (TLTF) to compute weight of term to obtain feature. It uses an improved k-means method to cluster sentences, and discovers thematic sentences according to clustering results. Experimental results indicate a clear superiority of the proposed method over the traditional method under the proposed evaluation scheme.

关 键 词:主题句发现 自动文摘 句子聚类 自然语言处理 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象