辽宁省高校创新团队支持计划(2009T045)

作品数:23被引量:101H指数:5
导出分析报告
相关作者:邱云飞邵良杉刘世兴林明明刘大有更多>>
相关机构:辽宁工程技术大学吉林大学更多>>
相关期刊:《现代情报》《模式识别与人工智能》《计算机工程与应用》《计算机系统应用》更多>>
相关主题:文本分类冗余度N-GRAMS加权算法特征加权更多>>
相关领域:自动化与计算机技术航空宇航科学技术文化科学电子电信更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多指标融合的文本特征评价及选择算法被引量:3
《计算机工程与应用》2016年第24期95-101,共7页邱云飞 刘世兴 王璐 
国家自然科学基金(No.70971059);辽宁省创新团队项目(No.2009T045);辽宁省高等学校杰出青年学者成长计划(No.LJQ2012027)
在文本分类问题中,有多种评价特征优劣的指标,其中主要有特征与类别的相关性、特征自身的冗余度和特征在语料中的稀疏程度。由于文本特征的优劣直接影响分类效果,全方位考虑特征的各个因素很有必要。特征选择常分为三步骤分别对相关性...
关键词:相关性 冗余度 稀疏程度 坐标系 
基于字矩阵交运算的n-grams特征选择加权算法被引量:1
《计算机工程与应用》2016年第22期86-92,共7页邱云飞 刘世兴 邵良杉 
国家自然科学基金(No.70971059);辽宁省创新团队项目(No.2009T045);辽宁省高等学校杰出青年学者成长计划(No.LJQ2012027)资助
中文文本中,传统的n-grams特征选择加权算法(如滑动窗口法等)存在两点不足:在将每个词进行组合、生成n-grams特征之前必须对每篇文本调用分词接口。无法删除n-grams中的冗余词,使得冗余的n-grams特征对其他有用的n-grams特征产生干扰,...
关键词:汉语单双字识别 字矩阵 交运算 特征选择 特征加权 
基于三维坐标的模糊量化情感分类方法
《中文信息学报》2016年第3期152-162,共11页林明明 邱云飞 邵良杉 
国家自然科学基金(70971059);辽宁省创新团队项目(2009T045);辽宁省高等学校杰出青年学者成长计划(LJQ2012027)
针对微博情感分类问题,构造了基于三维坐标的模糊量化情感分类算法,通过将情感模糊量化,对微博进行多情感分类。首先对情感模糊处理,将情感分为六大类,根据六大类,定义并计算句子的模糊情感;其次将情感量化处理,根据情感类别构造三维坐...
关键词:微博情感 模糊量化 情感分类 模糊情感 三维坐标 
基于相关性及语义的n-grams特征加权算法被引量:2
《模式识别与人工智能》2015年第11期992-1001,共10页邱云飞 刘世兴 林明明 邵良杉 
国家自然科学基金项目(No.70971059);辽宁省创新团队项目(No.2009T045);辽宁省高等学校杰出青年学者成长计划项目(No.LJQ2012027)资助
n-grams作为文本分类特征时易造成分类准确率下降,并且在对n-grams加权时通常忽略单词间的冗余度和相关性.针对上述问题,文中提出基于相关性及语义的n-grams特征加权算法.在文本预处理时,对n-grams进行特征约简,降低内部冗余,再根据n-gr...
关键词:最大相关度最小冗余度(mRMR) 语义相似度 N-GRAMS 特征加权 
商品隐式评价对象提取的方法研究被引量:5
《计算机工程与应用》2015年第19期114-118,共5页邱云飞 倪学峰 邵良杉 
国家自然科学基金(No.70971059);辽宁省创新团队项目(No.2009T045)
网络评论中没有明确指出评价对象的评论,如评论"东西有点贵"中并没有明确指出评价的是商品的价格。针对这种评论,提出一种在评论文本数据集上提取商品的隐式评价对象的方法。根据评论短文本的句式结构特点,构建出候选评价对象模型,并利...
关键词:隐式评价对象 特征词 聚类 K-MEANS聚类算法 
W-POS语言模型及其选择与匹配算法被引量:3
《计算机应用》2015年第8期2210-2214,2248,共6页邱云飞 刘世兴 魏海超 邵良杉 
国家自然科学基金资助项目(70971059);辽宁省创新团队项目(2009T045);辽宁省高等学校杰出青年学者成长计划项目(LJQ2012027)
n-grams语言模型旨在利用多个词的组合形式生成文本特征,以此训练分类器对文本进行分类。然而n-grams自身存在冗余词,并且在与训练集匹配量化的过程中会产生大量稀疏数据,严重影响分类准确率,限制了其使用范围。对此,基于n-grams语言模...
关键词:n-grams语言模型 词性 冗余度 稀疏数据 特征选择 
基于分布和逆文本类别指数的特征迁移加权算法被引量:1
《计算机应用》2015年第6期1643-1648,共6页邱云飞 刘世兴 林明明 邵良杉 
国家自然科学基金资助项目(70971059);辽宁省创新团队项目(2009T045);辽宁省高等学校杰出青年学者成长计划项目(LJQ2012027)
传统机器学习面临一个难题,即当训练数据与测试数据不再服从相同分布时,由训练集得到的分类器无法对测试集文本准确分类。针对该问题,根据迁移学习原理,在源领域和目标领域的交集特征中,依据改进的特征分布相似度进行特征加权;在非交集...
关键词:迁移学习 特征分布 逆文本类别指数 语义近似度 特征加权 
基于HGSD的消费情感分类算法被引量:2
《模式识别与人工智能》2015年第6期490-498,共9页林明明 邱云飞 邵良杉 
国家自然科学基金项目(No.70971059);辽宁省创新团队项目(No.2009T045);辽宁省高等学校杰出青年学者成长计划项目(No.LJQ2012027)资助
针对中文消费评价的情感分类问题,构造基于词典语义概念和上下文语义相结合的情感分类方法,对情感进行分类.该方法首先构造提取不同领域基准词集的方法.然后利用一元语言模型,通过How Net计算情感相似值,进行情感词提取.最后结合How Ne...
关键词:词典语义 上下文语义 情感分类 知网 Google相似距离 
基于二维坐标映射法的消费情感分类方法
《计算机应用》2014年第9期2571-2576,2599,共7页林明明 邱云飞 邵良杉 
国家自然科学基金资助项目(70971059);辽宁省创新团队项目(2009T045);辽宁省高等学校杰出青年学者成长计划项目(LJQ2012027)
针对中文消费评论的情感分类问题,构建了一种基于语料库的二维坐标映射法的情感分类方法。根据中文语言特点,首先提出了基于语料库的搜索方法,使搜索更有针对性;其次,定义了提取表达情感的中文短语的规则;第三,构造了某领域的最佳种子...
关键词:中文 消费评论 情感分类 语料库 二维坐标映射 
基于主题树的微博突发话题检测被引量:6
《计算机应用》2014年第8期2332-2335,共4页邱云飞 郭弥纶 邵良杉 
国家自然科学基金资助项目(70971059);辽宁省创新团队项目(2009T045);辽宁省高等学校杰出青年学者成长计划项目(LJQ2012027)
针对传统话题检测方法不能很好处理微博中用语不规范、随意性强、指代不明确以及存在大量网络用语的问题,提出了一种基于潜在狄利克雷分配(LDA)模型的主题树检测方法。首先,运用自然语言处理(NLP)中增大信息熵的方法将相关微博整理成一...
关键词:潜在狄利克雷分配 主题树 语义相似度 空间向量模型 话题检测 
检索报告 对象比较 聚类工具 使用帮助 返回顶部