检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:买哈铺热提.外力 赵梦原 艾斯卡尔.艾木都拉[1]
机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046 [2]清华大学语音和语言技术研究中心,北京100086
出 处:《计算机工程与应用》2015年第16期130-135,共6页Computer Engineering and Applications
基 金:国家自然科学基金项目(No.6163033);新疆维吾尔自治区高新技术发展研究计划(No.201312103);教育部新世纪优秀人才支持计划项目(No.NCET-10-0969)
摘 要:以互联网为代表的信息技术的发展使人们索取信息变得前所未有的便捷,同时也对如何有效利用信息提出了挑战。自动文摘技术通过自动选择文档中的代表句子,可以极大提高信息使用的效率。近年来,基于英文和中文的自动文摘技术获得广泛关注并取得长足进展,而对少数民族语言的自动文摘研究还不够充分,例如维吾尔语。构造了一个面向维吾尔语的自动文摘系统。首先利用维吾尔语的语言学知识对文档进行预处理,之后对文档进行了关键词提取,利用这些关键词进行了抽取式自动文摘。比较了基于TF-IDF和基于Text Rank的两种关键词提取算法,证明Text Rank方法提取出的关键词更适合自动文摘应用。通过研究证明了在充分考虑到维吾尔语语言信息的前提下,基于关键词的自动文摘方法可以取得让人满意的效果。As represented by the Internet,development of information technology has enabled people to obtain information easier than ever before,but it also presents challenges to the effective use of information.Automatic summarization techniques greatly improve efficiency in the use of information by automatically selecting representatives of the sentences in the document.In recent years,automatic summarization techniques based on English and Chinese received wide attention and achieved significant progress while the automatic summarization of minority languages is not sufficient,such as Uyghur language.This paper constructs a Uyghur-oriented automatic summarization system.Uyghur linguistic knowledge is used to handle the document,and then keywords which are extracted from the document is used for automatic text summarization.Two different TF-IDF-based and Text Rank-based extraction algorithms are compared; it proves Text Rank method is more suitable for automatic text summarization.It is demonstrated that on the premise of full account of Uygur language information,automatic text summarization based on keywords can achieve satisfactory results.
关 键 词:维吾尔文 自动文摘 TF-IDF算法 Textrank ROUGE
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38