关键词抽取

作品数:176被引量:1143H指数:21
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李涓子谢飞吕学强赵姝吴信东更多>>
相关机构:中国科学院清华大学北京邮电大学华中师范大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
基于舆情新闻的中文关键词抽取综述被引量:8
《计算机工程》2023年第3期1-17,共17页杨文忠 丁甜甜 康鹏 卜文秀 
国家自然科学基金(U1603115,62262065);国家重点研发计划子课题(2017YFC0820702-3);新疆维吾尔自治区重点科技专项(2020A02001-1);四川省区域创新合作项目(2020YFQ0018);新疆维吾尔自治区自然科学基金(2021D01C080)。
基于舆情事件的关键词抽取算法作为舆情监测的基础技术之一,其目的是在不同的舆情事件中抽取出人们关注的核心词汇,从而快速了解新闻内容。随着深度学习的发展,传统的无监督关键词抽取技术和有监督算法中的分类模型已经逐渐被基于深度...
关键词:舆情监测 关键词抽取 核心词汇 深度学习 自然语言处理 
融合语义特征的TextRank关键词抽取方法被引量:13
《计算机工程》2021年第10期82-88,共7页杨延娇 赵国涛 袁振强 韩家臣 
国家自然科学基金(61662068);甘肃省高等学校创新能力提升项目(2019A-006)。
TextRank使用共现窗口代替PageRank网页超链接以判断词语关系,但共现窗口机制下的词汇图是无向图,且实际中文文本中词语与其共现窗口内的词语之间在多数情况下没有认知上的指向性链接关系,导致共现窗口机制下的词语关系与PageRank网页...
关键词:TextRank方法 关键词抽取 依存关系 词性重要度 IDF方法 PageRank方法 
融合BERT语义加权与网络图的关键词抽取方法被引量:15
《计算机工程》2020年第9期89-94,共6页李俊 吕学强 
国家自然科学基金(61671070);国家语委重点科研项目(ZDI135-53)。
结合文档本身的结构信息与外部词语的语义信息,提出一种融合BERT词向量与TextRank的关键词抽取方法。在基于网络图的TextRank方法基础上,引入语义差异性并利用BERT词向量加权方式优化TextRank转移概率矩阵计算过程,同时通过迭代运算对...
关键词:关键词抽取 语义关系 词向量 TextRank方法 基于Transformer的双向编码器表示 
结合主题分布与统计特征的关键词抽取方法被引量:8
《计算机工程》2017年第7期217-222,共6页刘啸剑 谢飞 
国家自然科学基金(61229301)
传统人工抽取关键词耗时耗力,为了能自动从文档中抽取出高质量的关键词,提出一种关键词自动抽取方法。该方法基于文档和词语的主题信息并结合词语的统计特征为候选词语打分,最终选择TopK得分的候选词作为文档关键词。实验结果表明,该方...
关键词:主题分布 关键词抽取 统计特征 主题信息 候选词语 
基于语义扩展模型的中文网页关键词抽取被引量:4
《计算机工程》2012年第22期163-166,共4页汪洋 帅建梅 
国家"863"计划基金资助项目"结合语义的视频服务网站自动发现与分析评估"(2008AA01Z408)
提出一种基于语义扩展模型、分步骤的无监督关键词抽取方法。选择词语的网页结构特征、词性、词长、TF-IDF值等特征,通过聚类算法抽取候选关键词。根据n-gram语言模型理论,引入邻接变化数等特征构建基于词的语义扩展模型,采用无监督方...
关键词:中文网页关键词抽取 语义扩展模型 邻接变化数 聚类算法 n—gram语言模型 
基于关键词抽取的自动文摘算法被引量:11
《计算机工程》2012年第3期183-186,共4页蒋效宇 
北京市优秀人才培养资助专项科研基金资助项目(2009D005001000005)
针对生成文摘内容不完整的问题,利用相邻词的共现频率进行未登录词识别,提出一种通过词汇链的构建进行中文关键词抽取和文摘生成的算法,并给出一种采用《知网》为知识库构建词汇链的方法。通过计算词义相似度构建词汇链,结合词汇所在词...
关键词:自动文摘 向量空间模型 关键词抽取 词汇链 未登录词识别 
信息过滤中基于统计与规则的关键词抽取研究被引量:9
《计算机工程》2012年第2期57-59,共3页黄先珍 杨玉珍 刘培玉 
国家自然科学基金资助项目(60873247);山东省高新自主创新专项工程基金资助项目(2008ZZ28)
目前的研究大多把向量空间模型中特征项的选取与权重的计算分开,掩盖中文分词时产生的语义缺失,导致特征项区分度下降。为此,提出一种基于统计与规则的关键词抽取方法。利用句法规则提取出基本短语,以取代词袋模型中的词,考虑特征项位...
关键词:基本短语 合并规则 角色加权 分布加权 位置加权 
基于自动文本分类的关键词抽取算法被引量:18
《计算机工程》2009年第12期145-147,共3页张虹 
分析现有几种中文分词方法,提出一种关键词抽取算法。以词语的权重公式为中心,利用遗传算法训练、优化公式中的参数,得到一组适合中文文本的参数,提高文章子主题划分的精度。实验分析表明,该算法能将抽取系统中的命名实体有效地切分出来...
关键词:文本分类 分词技术 关键词抽取 遗传算法 
利用关联规则挖掘文本主题词的方法被引量:10
《计算机工程》2008年第7期81-83,共3页刘菲 黄萱菁 吴立德 
主题词抽取是目前信息检索领域研究的热点,与一系列数据挖掘相关的任务密切相关。该文提出一种新的利用关联规则挖掘中文文本主题词的方法,该方法抽取的主题词包括关键词和相关检索词两部分。在关键词抽取的基础上,采用数据挖掘中的关...
关键词:关键词抽取 关联规则挖掘 文本挖掘 
基于概率潜在语义分析的中文信息检索被引量:11
《计算机工程》2008年第2期199-201,共3页罗景 涂新辉 
传统的信息检索模型把词看作孤立的单元,没有考虑自然语言中存在大量的同义词、多义词现象,对召回率和准确率有不利的影响。概率潜在语义模型使用统计的方法建立"文档-潜在语义-词"之间概率分布关系并利用这种关系进行检索。该文将概率...
关键词:概率潜在语义分析 中文信息检索 索引技术 关键词抽取 
检索报告 对象比较 聚类工具 使用帮助 返回顶部