检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]太原科技大学应用科学学院,太原030024 [2]山西大学计算机与信息技术学院,太原030006
出 处:《计算机工程与应用》2011年第18期160-162,230,共4页Computer Engineering and Applications
基 金:国家自然科学基金(No.60970014);教育部高等学校博士点基金(No.200801080006);山西省自然科学基金(No.2010011021-1);太原市科技局明星专项(No.09121001);山西省科技攻关项目~~
摘 要:在文本的向量空间表示模型下,针对文本褒贬倾向判别问题,提出了一种基于潜在语义分析的特征权重计算方法。除词频信息外,该方法考虑了潜在语义分析所提供的同义词、近义词信息对特征权重的影响。采用基于Fisher判别准则的特征选择方法,以支持向量机作为分类器,在2739篇语料(2008年中文倾向性分析评测)上进行了实验。实验结果表明,提出的特征权重计算方法对文本褒贬倾向判别是有效的。On the basis of vector space model of text expression,a feature weight computing method for text commendatory-derogatory orientation discrimination is proposed based on Probabilistic Latent Semantic Analysis(PLSA).In addition to the word frequency of a feature,the information of its thesaurus and homoionym latently obtained by PLSA is taken in consider- ation to weight computing.Using the feature selection method based on Fisher criterion,and constructing a classifier with Sup- port Vector Machine(SVM),an experiment is conducted under a Chinese review text corpus with size of 2 739 documents (COAE2008).The experimental results indicate that the presented weight computing method based on PLSA is effective.
关 键 词:文本褒贬倾向判别 概率潜在语义分析 FISHER判别准则 支持向量机
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.216.1.197