马雯雯

作品数:2被引量:44H指数:2
导出分析报告
供职机构:重庆大学计算机学院更多>>
发文主题:隐含语义分析LSALATENTVSMSEMANTIC更多>>
发文领域:自动化与计算机技术文化科学更多>>
发文期刊:《计算机工程与应用》《计算机应用》更多>>
所获基金:重庆市自然科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于隐含语义分析的微博话题发现方法被引量:36
《计算机工程与应用》2014年第1期96-100,共5页马雯雯 魏文晗 邓一贵 
重庆市自然科学基金(No.cstc2011jjA40023)
随着微博的大量普及和关注度的不断提高,微博热点话题发现已成为当前研究热点。针对于短文本、向量空间模型(VSM)文本表示方法存在高维度、稀疏,以及同义多义问题,导致难以准确度量文本相似度,提出一种基于隐含语义分析的两阶段聚类话...
关键词:隐含语义分析 向量空间模型 话题发现 微博 两阶段聚类 LATENT SEMANTIC Analysis(LSA) Vector Space Model(VSM) 
新的短文本特征权重计算方法被引量:8
《计算机应用》2013年第8期2280-2282,2292,共4页马雯雯 邓一贵 
重庆市自然科学基金资助项目(cstc2011jjA40023)
短文本固有的特征稀疏和样本高度不均衡等特点,使得传统长文本的加权方法难以直接套用。针对此问题,提出一种针对短文本的特征权重计算方法——综合类别法。该方法引入反文档频和相关性频率的概念,综合考虑了样本在正类和负类中的分布...
关键词:短文本 特征权重 不均衡样本 文本分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部