检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:何新宇[1]
出 处:《中山大学研究生学刊(社会科学版)》2013年第3期43-50,共8页Journal of the Graduates Sun YAT-SEN University(Social Sciences)
摘 要:阐述了自动文摘和PageRank算法的概念和步骤,并介绍了部分基于图排序的自动摘录算法;提出了一种基于中心词耦合度和PageRank的图排序文本自动摘录算法,通过文本特征筛选技术提取出文档中的中心词并定义了句子之间的中心词耦合度函数,再将中心词耦合度应用在PageRank算法中,最后通过句子的PageRank值来生成摘录;以SUMMAC的Computation and Language语料库中的新闻文档作为实验对象,采用ROUGE作为摘录效果评价工具进行实验。实验结果表明,本文算法跟单纯PageRank摘要算法相比摘录效果和摘录效率都有所提升。This paper introduces the principle of text automatic extraction and PageRank. And alsointroduces some automatic extraction algorithmsbased ongraph sorting. After that,this paper put forward aatext automatic extraction algorithm based on coupling degree and PageRank. Firstly,this algorithm extracts keywords from documents and define an keyword-coupling function. Secondly,applying this function on PageRank iteration process. Using PageRank value of each sentence,finally,this algorithm generate summary. WithSUMMAC' s Computation and Language corpus,this methodology is experimentedand evaluated by ROUGE. Experimental result shows that with this method performs better than the traditional PageRank extraction algorithm.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3