主题词提取

作品数:27被引量:169H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周蓓蓓杨婉霞张晓东唐培丽邓聪更多>>
相关机构:电子科技大学南京邮电大学北京大学东软集团股份有限公司更多>>
相关期刊:《齐齐哈尔大学学报(自然科学版)》《图书馆杂志》《软件导刊》《吉林大学学报(信息科学版)》更多>>
相关基金:国家自然科学基金教育部人文社会科学研究基金国家高技术研究发展计划国家档案局科技项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于组合相似度动态聚类和词熵的网络话题在线检测
《情报杂志》2024年第5期159-166,共8页郭慧 王亚楠 王欣艳 魏艺泽 王养廷 
国家社会科学基金项目“重大疫情下社区健康边际及防护体系构建研究”(编号:21BSH072)研究成果。
[研究目的]为实现网络热点话题的在线检测,提升增量式聚类算法的聚类效果,提出了基于组合相似度的动态聚类算法,同时通过计算词熵实现主题词提取和演化跟踪。[研究方法]通过CIFG-BiLSTM-CRF模型实现文本的命名实体识别,计算文本与话题...
关键词:网络话题 在线话题检测 增量式聚类 主题词提取 组合相似度 动态聚类算法 词熵 
重大公共卫生事件中的舆情分析方法研究——以新冠肺炎疫情为例被引量:18
《地球信息科学学报》2021年第2期331-340,共10页韩珂珂 邢子瑶 刘哲 刘峻明 张晓东 
国家重点研发计划项目(2018YFC1508901-3)。
2019年12月以来,新冠肺炎疫情迅速席卷全球,截至北京时间2020年5月10日16时40分,全球累计确诊病例4 115 662例,已成为全球聚焦的主要话题。微博等社交媒体平台成为此次疫情相关信息传播的重要渠道和公众情绪的有效传感器之一。对微博信...
关键词:新冠肺炎 微博 情感分析 空间聚类 舆情 主题词提取 热点挖掘 爬虫 
基于情感主题特征词加权的微博评论聚类算法研究被引量:2
《现代电子技术》2020年第23期67-71,75,共6页吴迪 杨瑞欣 申超 
国家自然科学基金资助项目(61802107);国家重点研发计划(2018YFF0301004);河北省高等学校科技攻关项目(ZD2018087,ZD2016017);河北省专业学位研究生教学案例建设项目(KCJSZ2018083);河北省自然科学基金青年基金项目(F2019402428)。
为了提高微博评论的情感分析聚类效果,提出一种基于情感主题特征词加权的微博评论聚类算法。该算法首先通过定义情感主题词袋提取情感主题词;然后利用语义相似度计算获得情感主题特征词,进一步通过定义情感主题特征词重要度和分布度对...
关键词:微博评论 聚类算法 LDA聚类 情感分析 特征词加权 主题词提取 
基于Att-iBi-LSTM的新闻主题词提取方法研究
《武汉工程大学学报》2020年第5期575-580,共6页柴悦 赵彤洲 江逸琪 高佩东 
国家自然科学基金(61601176);武汉研究院开放性课题(IWHS20192031)。
针对LSTM网络进行主题词提取时因没有考虑中心词的下文对主题词的影响而导致提取准确率低的问题,提出了一种双向LSTM引入Attention机制模型(Att-iBi-LSTM)的主题词提取方法。首先利用LSTM模型将中心词的上文和下文信息在两个方向上建模...
关键词:LSTM Attention机制 主题词提取 
基于LDA耦合空间模型的作文跑题检测方法研究被引量:2
《计算机应用研究》2019年第12期3544-3547,共4页孟超颖 宋文爱 富丽贞 
国家自然科学基金资助项目(61602427);山西省自然科学基金资助项目(201601D202037)
传统的跑题检测方法大部分是将文本转换为向量空间的向量表示,再计算与正确文章之间的相似度来得到是否跑题的结果,然而这种方法仅针对文章语句结构上的表示,却忽略了文章语义上的关联,并且对于题目发散度较高的作文跑题检测效果较低。...
关键词:作文跑题检测 耦合空间 主题词提取 相关度 
基于Python的微博用户分析系统设计与实现被引量:5
《计算机产品与流通》2019年第6期282-283,288,共3页赵亮 赖研 仝鑫 
河南警察学院院级课题成果"基于机器学习的社交网络信息分析方法研究"(编号:HNJY-2017-11)
本文设计并实现了一个微博用户分析系统,本系统的开发全部基于Python库及框架,使用爬虫技术采集用户微博发布内容,可以对文本内容进行词频统计,主题词提取,情感分析,对图片内容进行人脸检测与提取。通过本系统可以快速展示单个用户微博...
关键词:微博 爬虫 主题词提取 情感分析 人脸检测 
基于改进TF-PDF算法的地震微博热门主题词提取研究被引量:8
《地理与地理信息科学》2018年第4期90-95,共6页苏晓慧 张晓东 胡春蕾 邹再超 邱晓康 
国家重点研发计划项目(2016YFB0502502);中央高校基本科研业务费专项资金项目(BLX2013034)
随着网络通讯技术的发展和社交媒体工具的普及,越来越多的公众在微博平台发布、传播地震相关信息,而如何从这些信息中获取有用信息并为开展地震应急工作提供方向性的指导,成为研究的重点及难点。该文提出一种改进的TF-PDF算法,通过发布...
关键词:地震热门主题词 信息提取 微博抓取 微博影响力 TF-PDF 
扎根理论三阶段编码对主题词提取的应用研究被引量:59
《图书馆杂志》2018年第5期74-81,共8页王念祖 
主题词提取是主题标引的重要过程。但目前的主题词提取,一方面较偏重于主题词的词义本身,忽略主题词与主题词之间可能存在某种相互链接的"关系";另一方面,其提取过程也缺乏一种可供检验的可视化路径。据此,研究者尝试以"扎根理论"中的...
关键词:主题词提取 主题标引 扎根理论 编码 
基于句子聚类的中文文本自动摘要算法的研究被引量:1
《微型电脑应用》2017年第8期54-56,共3页杨毅 
在搜索引擎和新闻内容推荐等多个领域都有着非常广阔的应用。
关键词:句子聚类 主题词提取 词向量 文本自动摘要 
面向机器人竞赛的文献分析与主题词提取被引量:1
《情报工程》2017年第1期81-86,共6页刘涵 刘京旋 
近年来,机器人教育在我国愈发受重视,针对机器人的竞赛也受到更多中小学、高校的教师与专家的关注。本文通过查阅机器人竞赛相关文献,介绍国内外机器人教育现状,分析国内的机器人教育文献,针对机器人竞赛的文献采用基于统计的方法,自动...
关键词:知识图谱 表示学习 规则挖掘 推理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部