检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]重庆大学计算机学院 [2]重庆大学语言认知及信息处理研究所,重庆400044
出 处:《广西师范大学学报(自然科学版)》2006年第4期187-190,共4页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家自然科学基金资助项目(60173060)
摘 要:在分析自动文摘现有方法优缺点的基础上,提出了一种基于统计、语义和结构特征的自动文摘方法。用这些特征构成句子向量表示,并用机器学习的方法对其进行训练得到器,从而把自动文摘转换为分类问题。实验表明,该方法具有较好的重合率。同时,为了解决文摘的冗余和不连贯缺点,进行了一系列的后期处理,提高了文摘的质量。This paper presents a new automatic summarization method based on statistic, semantic and structural features while the advantages and disadvantages are analyzed for the popular methods of automatic summarization. There are eight features used to form the feature vector for each sentence,and the summarizer is gained by machine learning algorithms ,so automatic summarization is changed into classification task. The experiment results show that the method maintains higher precision. Meanwhile,the paper processes a series of post processing to overcome the shortcoming of redundancy and incoherence, and it improves largely the quality of summary.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.42