检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽大学计算机科学与技术学院,合肥230039
出 处:《计算机工程》2012年第16期170-173,共4页Computer Engineering
基 金:安徽省自然科学基金资助项目(11040606M133)
摘 要:传统自动文摘方法生成的文摘结果指代关系模糊,且对于某些段落结构有规律的文章,没有分析文章结构与主题思想之间的关系。为此,提出一种基于指代消解和篇章结构分析的自动摘录算法。采用有限知识的思路完成指代消解,利用指代消解解决文摘语义不连贯问题,以提高句子权重计算的准确性,对文章做主题划分时进行篇章结构识别,按照段落标题信息划分段落结构。实验结果表明,该算法在受限金融领域文本自动摘录中,具有较高的准确率和召回率。There are some problems should be considered in automatic extraction of traditional methods: Conference relations in the result of automatic extraction are not clear, some relationships between obvious structures of paragraphs and the theme of the text are not paid enough attention. For which, this paper presents a method based on anaphora resolution and text structure analysis, which combines the traditional statistics with regulars on automatic abstract. This method applies limited knowledge to pronoun resolution, which is to solve the problem of semantic incoherence, also to improve the precision when computing sentences' weight. Based on sequential paragraphic similarity, this method can recognize obvious topics to partition text. Experimental results show that this method improves precision and recall when it is applied for limited-financial field.
关 键 词:自然语言处理 自动摘录 向量空间模型 主题划分 篇章结构 指代消解
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15