检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:热依莱木.帕尔哈提 孟祥涛[2,3] 艾斯卡尔.艾木都拉[1]
机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046 [2]清华大学信息技术研究院,北京100084 [3]重庆邮电大学计算机科学与技术学院,重庆400065
出 处:《计算机工程》2014年第10期132-136,142,共6页Computer Engineering
基 金:国家自然科学基金资助项目(61065005;61163033);教育部新世纪优秀人才支持计划基金资助项目(NCET-10-0969);新疆维吾尔自治区高新技术研究发展计划基金资助项目(201312103)
摘 要:在研究区分性关键词提取方法的基础上,对维吾尔语中的生气和高兴等常见情感类型进行基于文本句子的情感分类研究。结合维吾尔文本句子中的情感表达特点,以词频和文档频率作为基本统计量,通过计算同一词语在不同组合统计量下的类间差异得到区分性关键词,并基于这些关键词进行特征提取和区分性情感模型构建。从维吾尔语电影字幕、小说等文本库中提取生气和高兴2种情感构造实验数据集,并验证所提出的情感分类方法。实验结果表明,基于区分性关键词的建模方法能有效地对维吾尔文本句子进行情感分类。This paper presents a classification approach for Uyghur text sentiment,such as angry and happy,based on discriminative key word extraction. Combined with the characteristics of sentiment expression in Uyghur text, the term frequency and document frequency are derived as primary statistics. Various discriminative statistics which reflect the discrepancy of the positive and negative sentiment datasets are derived from the primary statistics for each vocabulary word, and are used to extract discriminative key words. Features are extracted based on these keywords and are used to train discriminative sentiment models. This paper builds a sentiment text database by excerpting two sentiments:angriness and happiness from Uyghur movie transcriptions and novels,and verifies the proposed approach. Experimental results show that the method based on discriminative keyword extraction is effective in Uyghur text sentence sentiment classification.
关 键 词:维吾尔语 区分性 文本句子 情感分类 差异性统计量
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38