潜在语义

作品数:430被引量:1567H指数:17
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王明文牛奉高林鸿飞曾雪强吴国良更多>>
相关机构:大连理工大学山西大学南京大学北京理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家教育部博士点基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
基于潜在语义分析的文本指纹提取方法被引量:8
《中文信息学报》2018年第5期74-79,共6页崔彤彤 崔荣一 
国家语委"十二五"科研规划项目(YB125-178);吉林省科技发展计划项目(20140101186JC)
网络化大数据时代的到来丰富了网络空间中的信息资源,然而由于数据资源类型的多样性及其增长的快速性,给网络空间的存储和信息资源的有效利用带来了压力和挑战。该文提出了一种基于潜在语义分析的文本指纹提取方法,该方法是对数据信息...
关键词:文本指纹 奇异值分解 潜在语义分析 随机超平面原理 
基于共现词映射的中英韩跨语种文档相似度计算
《中文信息学报》2018年第3期55-63,共9页刘娇 崔荣一 赵亚慧 
国家语委2015年度科研立项项目(教语信司函[2015]21号)
该文采用中英韩跨语种文本数据研究不同语种文档间相似度的计算方法。首先,通过共现词映射将某语种空间中的文档向量表示成另一语种空间中的文档向量;其次,利用潜在语义分析补充了不同语言间一词多义现象造成的向量缺失;最后,在具有等...
关键词:跨语种文档相似度 共现词 潜在语义分析 
基于概率潜在语义分析的词汇情感倾向判别被引量:15
《中文信息学报》2011年第2期89-93,共5页宋晓雷 王素格 李红霞 李德玉 
国家自然科学基金资助项目(60875040;60970014);教育部高等学校博士点基金资助项目(200801080006);山西省自然科学基金资助项目(2007011042;2010011021-1);太原市科技局明星专项资助项目(09121001);山西省科技攻关项目
该文利用概率潜在语义分析,给出了两种用于判别词汇情感倾向的方法。一是使用概率潜在语义分析获得目标词和基准词之间的相似度矩阵,再利用投票法决定其情感倾向;二是利用概率潜在语义分析获取目标词的语义聚类,然后借鉴基于同义词的词...
关键词:概率潜在语义分析 数据稀疏 语义聚类 情感倾向 
一种基于LDA的潜在语义区划分及Web文档聚类算法被引量:19
《中文信息学报》2011年第1期60-65,70,共7页刘振鹿 王大玲 冯时 张一飞 方东昊 
国家自然科学基金资助项目(60973019);国家863计划资助项目(2009AA01Z131)
该文应用LDA模型进行文档的潜在语义分析,将语义分布划分成低频、中频、高频语义区,以低频语义区的语义进行Web游离文档检测,以中、高频语义区的语义作为文档特征进行文档聚类,采用文档类别与语义互作用机制对聚类结果进行修正。与相关...
关键词:LDA 潜在语义 语义分布 文档聚类 
基于核偏最小二乘分类的垃圾邮件过滤被引量:2
《中文信息学报》2009年第2期48-53,共6页岑芳明 王明文 王鹏鸣 戴玉娟 
国家自然科学基金资助项目(60663007);江西省科技攻关项目(2006-184);江西省教育厅科技项目(2007-129)
垃圾邮件是Internet上亟待解决的问题,目前许多垃圾邮件过滤技术已经被使用。基于偏最小二乘的方法可以解决垃圾邮件的内容中普遍存在的数据稀疏性、高特征维数和多重相关性问题。但邮件内容之间的内在联系往往不是线性的,该文通过在偏...
关键词:计算机应用 中文信息处理 垃圾邮件过滤 非线性 核偏最小二乘 回归 分类 潜在语义 
潜在语义索引中特征优化技术的研究被引量:7
《中文信息学报》2009年第2期69-76,共8页季铎 郑伟 蔡东风 
国家863计划课题资助项目(2006AA01Z148);教育部科学技术研究重点项目(207148)
潜在语义索引被广泛应用于信息检索、文本分类、自动问答等领域中。潜在语义索引是一种降维方法,它把共现特征映射到同一维空间上,而非共现特征映射到不同的空间上。在潜在语义索引的语义空间中,共现特征通过文档内部以及文档之间的...
关键词:计算机应用 中文信息处理 潜在语义索引 共现特征 奇异值分解 特征选择 
一种新的基于中间语义的跨语言信息检索模型被引量:9
《中文信息学报》2009年第2期77-82,共6页黄国斌 王明文 叶浩 
国家自然科学基金资助项目(60663007);江西省科技攻关项目(20062184);江西省教育厅科技项目(20072129)
目前的跨语言信息检索能够使用的方法有四种:查询词翻译的方法、文档翻译的方法、中间语言翻译方法和非翻译的方法。该文对这四种方法进行了简要介绍,提出它们的优缺点,并且提出了一种新的非翻译的方法——基于中间语义的方法。我们对...
关键词:计算机应用 中文信息处理 跨语言信息检索 中间语义 潜在语义对 偏最小二乘 TREC 
潜在语义分析权重计算的改进被引量:19
《中文信息学报》2005年第6期64-69,共6页刘云峰 齐欢 Xiang’en Hu Zhiqiang Cai 
自从潜在语义分析方法诞生以来,被广泛应用于信息检索、文本分类、自动问答系统等领域中。潜在语义分析的一个重要过程是对词语文档矩阵作加权转换,加权函数直接影响潜在语义分析结果的优劣。本文首先总结了传统的、已成熟的权重计算方...
关键词:计算机应用 中文信息处理 潜在语义分析 权重 文档全局权重 文档自检索矩阵 
基于内容和合作模式的信息推荐机制被引量:14
《中文信息学报》2005年第1期48-55,共8页林鸿飞 杨志豪 赵晶 
国家自然科学基金资助项目 (6 0 3730 95 )
如何根据用户的兴趣向用户推荐相关信息成为目前研究的热点 ,本文提出了基于内容和合作模式的信息推荐机制。其基本思想是根据用户所关心的文本内容将用户划分为不同的内容类 ,同时按照用户的访问模式以及用户评注的一致性 ,将用户分成...
关键词:计算机应用 中文信息处理 潜在语义分析 用户评注 FISHER判别分析 推荐机制 访问模式 
双语交叉分类模型的设计与实现
《中文信息学报》2001年第6期27-32,共6页林鸿飞 王剑峰 
利用交叉分类机制共享因特网上各种语言的信息资源是知识挖掘的重要方法 ,本文给出了双语交叉分类的模型以及实现方法。其主要思想是不需要进行机器翻译和人工标注 ,利用文本特征抽取机制提取类别特征项和文本特征项 ,通过基于概念扩充...
关键词:双语交叉文本分类 概念扩充 潜在语义分析 空间向量模型 知识挖掘 语义相似度 文本特征抽取机制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部