文本聚类

作品数:1002被引量:4956H指数:28
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄瑞章徐森章成志秦永彬王正欧更多>>
相关机构:北京邮电大学贵州大学哈尔滨工业大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于动态主题情感模型的文本聚类算法
《吉林大学学报(理学版)》2025年第2期528-536,共9页胡萍 
国家自然科学基金面上项目(批准号:62066040);教育部人文社科青年基金(批准号:20YJC880030);铜仁学院博士科研启动基金(批准号:trxyDH1914)。
针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模...
关键词:动态主题情感模型 文本挖掘 情感标签 时间戳 文本聚类 困惑度 
基于深度文本聚类的关键词语义多模态挖掘方法
《信息技术与信息化》2025年第3期153-157,共5页周春良 杨畅畅 李晓辉 
郑州西亚斯学院2024年度校级科研项目(2024XKD077);河南省本科高校2023年度产教融合研究项目;郑州西亚斯学院应用型本科高校建设专项教改项目(2022YYXZX01)。
多模态数据具有信息丰富性,但单一挖掘方法往往难以全面把握其互补、冗余和协同的关联,导致结果不精确或片面。针对这一问题,文章提出了一种新颖的基于深度文本聚类的关键词语义多模态挖掘方法。首先,利用深度学习的半监督学习算法,精...
关键词:深度文本聚类 半监督学习算法 BWP指标 语义映射 语义挖掘 
基于聚类模型的国内实验室安全事故成因识别及对策研究
《中阿科技论坛(中英文)》2025年第2期102-107,共6页李占斌 刘杨 王金云 孟军 
2023年度宁夏回族自治区重点研发计划项目“基于标识解析的宁夏葡萄酒产业数字化关键技术及应用研究”(2023BDE02001);2019年度宁夏回族自治区级教育教学改革研究重点项目“全区高校实验室信息数据监控与实验室安全报告”(NXBJGZ-3);2024年度北方民族大学研究生创新项目“基于领域知识图谱的宁夏葡萄酒产业数字化水平提升路径研究”(YCX24418)。
为了有效防范实验室安全事故,文章以2008—2023年间发生的46起实验室安全事故案例作为研究对象,统计了事故的发生年份、事故数量、受伤人数、死亡人数等信息,利用K-Means算法对46起实验室安全事故文本进行了聚类,得到了6个聚类簇以及各...
关键词:文本聚类 K-MEANS算法 实验室事故 事故分析 
油气钻井现场工人不安全行为模式研究——基于文本挖掘视角
《中国安全生产科学技术》2025年第1期146-152,共7页朱林 罗筵疆 黄思琪 钟赟 唐桃 岑康 
国家社会科学基金重大项目(22&ZD105);国家社会科学基金项目(20XJY006);四川省哲学社会科学基金项目(SCJJ24ND060);四川省软科学研究计划项目(2017ZR0155);西南石油大学科研“启航计划”项目(202111103);西南石油大学校级人文社科专项基金项目(2021RW041);中国建设劳动学会《住房和城乡建设高质量发展要素和人才支撑》科研项目(CCLI2023R002);成渝地区双城经济圈科技创新与新经济研究中心2023年度科研项目(CYCX2023ZC06)。
为加强油气钻井现场安全管理,理解钻井现场工人不安全行为规律,提出基于文本挖掘视角的钻井现场工人不安全行为模式分析框架,以钻井现场工人违章数据为实例进行验证。首先采用频率分析和网络分析方法发现钻井工人高频不安全行为热点,其...
关键词:安全社会工程 不安全行为 智能文本挖掘 油气现场工人 文本聚类 关联规则 行为模式 
图书馆数字文本智能聚类个性化推荐应用研究
《无线互联科技》2025年第2期107-111,120,共6页江新姿 高尚 
国家自然科学项目,项目名称:融合样本先验分布信息的类别不平衡学习理论与算法研究,项目编号:62176107;镇江社科联项目,项目名称:数字化技术赋能提升镇江市公共文化服务水平研究,项目编号:2024YBL142。
Web 2.0信息时代,信息量迅速增加,信息检索速率却显著降低,如何提高信息的自动分类管理水平,从海量数据中高效、准确、快速获取有价值的信息与知识成为智慧图书馆亟待研究与解决的问题。文章提出了在数字图书馆服务中运用新型文本聚类...
关键词:文本聚类 K-MEANS聚类 混合蚁群聚类算法 个性化推荐 语义相似度 
融合知识组织体系的层次化主题挖掘方法研究
《数据分析与知识发现》2024年第12期39-51,共13页于诗睿 李爱花 杨雪梅 李晓瑛 陈逸菲 唐小利 
中国医学科学院医学与健康科技创新工程2021年重大协同创新项目(项目编号:2021-I2M-1-033)的研究成果之一
【目的】识别某学科领域科技文献数据中蕴含的主要研究主题,并将这些主题组织形成层次结构。【方法】将知识组织体系中的先验知识融入上下文嵌入聚类主题模型,并对知识组织体系中未登录词对应的主题进行分层分类,选择生物医学领域的数...
关键词:层次主题模型 知识组织体系 主题挖掘 文本聚类 自然语言处理 
基于IBTM-TMW 的信号设备故障文本聚类方法
《中国铁道科学》2024年第6期194-201,共8页杨妮 张友鹏 左静 赵斌 
国家自然科学基金资助项目(51967010,52262045);甘肃省自然科学基金资助项目(21JR7RA292)。
针对信号设备故障文本数据存在的长度短、专业性强及难以智能化再利用等问题,提出基于改进的词对主题模型和词向量融合(IBTM-TMW)的信号设备故障文本聚类方法。首先,为减少数据噪音,提升数据质量,在数据预处理过程中引入自建词典和保留...
关键词:故障诊断 主题模型 词向量 权重 文本聚类 
基于深度学习的海洋热点新闻挖掘方法
《计算机科学》2024年第S02期98-107,共10页覃娴萍 丁昭旭 仲国强 王栋 
科技创新2030-“新一代人工智能”重大项目(2018AAA0100400);山东省自然科学基金(ZR2020MF131,ZR2021ZD19);青岛市科技计划项目(21-1-4-ny-19-nsh);中国海洋大学图书情报研究基金(202253006)。
移动互联网的快速发展和现代移动客户端的普及推动了网络新闻行业、社交媒体和自媒体等的蓬勃发展,为用户提供了多元、丰富的海量信息。随着我国海洋强国战略的稳步推进,国民海洋意识的显著增强,有关海洋领域的多方面信息充斥着网络,相...
关键词:海洋新闻 文本聚类 自动摘要 深度学习 自然语言处理 预训练模型 
基于自适应结构学习的深度文本聚类被引量:1
《计算机工程》2024年第11期89-97,共9页潘伟 黄瑞章 任丽娜 薛菁菁 
国家自然科学基金(62166007);贵州省自然科学基金(黔科合基础ZK[2022]027)。
近年来,将结构信息应用于深度文本聚类中以提升聚类效果取得了较优的成果。然而,结构信息的构造方法大多只进行简单的距离测算且近邻数量固定,导致构建的图难以获得较精确的文本结构信息。另外,众多方法对近邻文本只进行一阶挖掘,使图...
关键词:阈值 深度文本聚类 文本结构信息 图神经网络 自适应结构学习 
基于改进CFSFDP算法的文本聚类方法研究
《中国高新科技》2024年第21期29-31,共3页常娟 
2021年陕西科技大学镐京学院校级科研项目“基于多密度峰值的CFSFDP算法改进及其应用研究”(项目编号:21XJ13)。
为进一步提升电信投诉文本的聚类效果,以便更高效地分析与处理用户反馈,文章首先概述CFSFDP算法与差分进化算法;其次,设计一种改进的CFSFDP聚类方法,运用差分进化算法实现了对CFSFDP算法中重要参数的自动寻优,大幅提高聚类准确性;最后,...
关键词:CFSFDP算法 文本聚类 聚类算法 
检索报告 对象比较 聚类工具 使用帮助 返回顶部