检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈燕敏[1] 王晓龙[1] 刘远超[1] 楼喜中[1]
机构地区:[1]哈尔滨工业大学计算机科学与技术系,黑龙江哈尔滨150001
出 处:《计算机工程与应用》2004年第33期11-14,共4页Computer Engineering and Applications
基 金:国家自然科学基金(编号:60373100);国家863高技术研究发展计划项目基金(编号:2002AA117010-09)
摘 要:文章介绍了一种新的使用自然语言处理技术的自动系统。通过融合基于内容的方法和基于主题的方法,将主题与内容相结合,生成具有良好连贯性和流畅性的。该方法首先对主题词进行分析,动态地处理具有抽象标题和具体标题的文档;然后采用词汇、语法、语义分析等自然语言处理技术,对文章的文本内容进行深入分析;再根据线性加权融合两种分析得到的结果,生成;最后采用指代消解技术使生成的更连贯流畅。与仅基于内容的自动文摘系统相比较,评测结果显示,该系统生成的质量有明显提高。A new system using Natural Language Processing techniques is proposed.It processes documents not only based on content of original texts by analyzing its structure,but also based on topics of summaries,which are determined by user or text title.The method first analyzes subjective words and processes the document with abstract title or actual title separately;then a method based on content is adopted by integrated many kinds of NLP technologies;the results produced by above two methods are fused to generate the summary;the anaphora resolution technology is applied to improve the fluency of the summary last.Evaluation results show that quality summaries are produced from arbitrary Chinese text.The proposed system is compared to system based on content and it is shown that it produces either comparable or better summaries overall.
关 键 词:自动文摘 自然语言处理 主题分析 内容分析 融合
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.104