受限领域的自动文摘方法研究  被引量:1

Study on Domain-Dependent Automatic Text Summarization

在线阅读下载全文

作  者:耿增民[1] 刘万春[1] 朱玉文[1] 

机构地区:[1]北京理工大学计算机科学技术学院

出  处:《北京理工大学学报》2006年第8期712-715,共4页Transactions of Beijing Institute of Technology

基  金:国家部委基金资助项目(2003WL01)

摘  要:为解决受限领域统计型文摘对文档中心内容理解不足的缺陷,研究了结合领域知识生成单文档文摘的方法;论述了构建受限领域的语料库和知识库的方法;提出对粗文摘进行文摘句概化和在其中加入领域知识的文摘后处理方法.在所提出理论基础上开发了文摘系统软件.通过和MS Word 2003中的文摘工具进行实验对比,表明提出的方法切实可行,可以推广到其它领域.Studies ways of generating text summary by utilizing domain knowledge to dissolve the limitation that statistical summary is defective in understanding document meanings. Discusses methods in constructing the corpus and knowledge base; proposes methods to postprocess the summary by generalizing summary sentences and adding knowledge to the summary. Developes text summarizing software based on the theory presented. In comparing it with MS Word 2003, it is seen that the approaches are effective and efficient; and can be extended to other domains.

关 键 词:自动文本摘要 知识库 语料库 文摘框架 文摘后处理 

分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象