自适应确定摘要长度  被引量:3

Determining the Length of Textual Summarization Adaptively

在线阅读下载全文

作  者:王建会[1] 胡运发[1] 李荣陆[1] 

机构地区:[1]复旦大学计算机与信息技术系,上海200433

出  处:《计算机研究与发展》2004年第3期399-406,共8页Journal of Computer Research and Development

基  金:国家自然科学基金项目 ( 60 173 0 2 7)

摘  要:随着信息技术的发展和信息量的大量增多 ,提出了很多自动摘要的算法 在这些众多的算法中 ,都有一个共同的现象———摘要的长度均需事先给定 然而 ,实际的情况是 ,随着信息样本的不同 ,该信息样本所包含的信息量也是不同的 为了能够全面地反映信息样本的主题思想 ,又不产生信息冗余 ,就要求根据具体信息样本 ,动态地确定与该样本信息量相适应的结果摘要长度 据此 ,提出了一种自适应于不同样本的、动态确定摘要长度的算法 ,从具体样本中循序渐进地抽取出其所包含的所有子主题 ,这些子主题的集合构成了该信息样本的主题思想 然后 ,再根据子主题的数量确定摘要的长度 ,既全面地反映了信息样本的内容 ,又不会产生信息冗余 另外 ,还提出了新的互依赖模型 ,使用该模型可以使切词的结果较为准确 ,并可有效地降维 。With the continuing growth of the information and the information technology, many algorithms of automatically summarising texts are put forward, all of which need to predetermine the length of summarization But the number of subtopics in one document is different from that in others In order to express one document at length without any information redundance, a new algorithm to determine the length of summarization adaptively and automatically is offered Furthermore, a new module of mutual dependence is brought out By using the new algorithm and the new module, the length of summarization can be determined adaptively to different texts, the dimension of the vector space can be reduced, the computational complexity can decline, and the precision of summarization can be increased

关 键 词:自动摘要 互依赖 摘要长度 N-GRAM 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象