代宁

作品数:4被引量:21H指数:2
导出分析报告
供职机构:教育部更多>>
发文主题:文本短文主题特征主题模型本分更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程》《计算机工程与应用》《合肥师范学院学报》《工业控制计算机》更多>>
所获基金:安徽省高校省级自然科学研究项目安徽省自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
融合BTM主题特征的短文本分类方法被引量:11
《计算机工程与应用》2016年第13期95-100,共6页郑诚 吴文岫 代宁 
安徽省高校自然科学研究重点项目(No.KJ2013A020);安徽省自然科学基金(No.11040606M133)
针对短文本特征较少而导致使用传统文本分类算法进行分类效果并不理想的问题,提出了一种融合BTM主题特征和改进了特征权重计算的综合特征提取方法来进行短文本分类。方法中,在TF-IWF的基础上降低词频权重并引入词分布熵,衍生出新的算法...
关键词:短文本 权重计算 TF-IWF方法 主题模型 
基于类序列规则的中文微博情感分类被引量:9
《计算机工程》2016年第2期184-189,194,共7页郑诚 沈磊 代宁 
安徽省高校自然科学基金资助重点项目(KJ2013A020);安徽省自然科学基金资助项目(11040606M133)
研究中文微博文本的情感分类问题,介绍一种基于类序列规则的微博情感分类方法。通过情感词典和机器学习的方法获得微博文本中每个句子的2个潜在的情感标签,将每条微博文本看作是一个数据序列,从数据集中挖掘出类序列规则,从挖掘出的规...
关键词:情感分类 微博文本 类序列规则 情感词典 机器学习 文本特征 
面向特定领域自动问答系统的语句相似度计算被引量:1
《合肥师范学院学报》2015年第6期38-41,共4页李健 郑诚 代宁 
安徽省高校自然科学研究重点项目(KJ2013A020)资助;安徽大学科研训练计划资助
本文针对教务管理系统学生选课自动问答系统,提出一种语句相似度计算方法。该方法先采用基于布尔型VSM掩码的方法实现问题的初分类,再采用改进的编辑距离算法计算句子相似度来判断FAQ库的匹配,从而使系统返回问题的答案。实验结果表明...
关键词:问答系统 向量空间模型 编辑距离 相似度计算 
一种短文本主题特征的改进方法
《工业控制计算机》2015年第8期110-112,共3页郑诚 代宁 
安徽省高校自然科学研究重点项目(KJ2013A020);安徽省自然科学基金(11040606M133)
主题模型被用来进行文本主题挖掘已经被证明是一个非常有效的手段,随着即时通讯的发展,挖掘短文本的主题特征也变得越来越重要。由于短文本的稀疏性,把传统的主题模型(如LDA)直接用在短文本上,生成的主题特征效果并不好。在研究LDA主题...
关键词:数据挖掘 短文本 词对 LDA 主题模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部