检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王萌[1] 李春贵[1] 唐培和[1] 王晓荣[2]
机构地区:[1]广西工学院计算机工程系,柳州545006 [2]华中师范大学计算机科学系,武汉430079
出 处:《计算机工程》2007年第8期180-181,189,共3页Computer Engineering
基 金:广西科学基金资助项目(桂科自0481016);2006年度广西教育厅科研资助项目(149);广西工学院博士基金资助项目
摘 要:提出了一种基于主题句发现的中文自动文摘方法。该方法使用术语代替传统的词语作为最小语义单位,采用术语长度术语频率方法进行术语权重计算,获得特征词。利用一种改进的k-means聚类算法进行句子聚类,根据聚类结果进行主题句发现。实验表明,该算法所得到的文摘,在各项指标上优于传统的文摘。Automatic summarization is one of main research fields in natural language processing. This paper proposes a special Chinese automatic summarization method based on discovering thematic sentences, which uses terms as minimal semantic unit rather than word, and employs term length term frequency (TLTF) to compute weight of term to obtain feature. It uses an improved k-means method to cluster sentences, and discovers thematic sentences according to clustering results. Experimental results indicate a clear superiority of the proposed method over the traditional method under the proposed evaluation scheme.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171