主题分类

作品数:230被引量:432H指数:10
导出分析报告
相关领域:自动化与计算机技术文化科学更多>>
相关作者:李建华苏彦捷张佳昱陈式卢小宾更多>>
相关机构:平安科技(深圳)有限公司上海交通大学武汉大学电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 学科=自动化与计算机技术—计算机应用技术x
条 记 录,以下是1-10
视图:
排序:
基于知识增强和提示学习的小样本新闻主题分类方法被引量:1
《计算机应用》2024年第6期1767-1774,共8页余新言 曾诚 王乾 何鹏 丁晓玉 
国家自然科学基金资助项目(62102136);湖北省重点研发计划项目(2021BAA188,2021BAA184,2022BAA044)。
基于预训练微调的分类方法通常需要大量带标注的数据,导致无法应用于小样本分类任务。因此,针对中文小样本新闻主题分类任务,提出一种基于知识增强和提示学习的分类方法KPL(Knowledge enhancement and Prompt Learning)。首先,利用预训...
关键词:新闻主题分类 提示学习 知识增强 小样本学习 文本分类 
基于异构图神经网络的半监督网站主题分类
《计算机工程与科学》2024年第4期635-646,共12页王谢中 陈旭 景永俊 王叔洋 
宁夏回族自治区重点研发项目(2023BDE02017);北方民族大学中央高校基本科研业务费专项资金(2022PT_S04)。
互联网网站数量快速增长使现有方法难以准确分类特定网站主题,如基于URL的方法无法处理未反映在URL中的主题信息,基于网页内容的方法受到数据稀疏性和语义关系捕捉的限制。为此,提出一种基于异构图神经网络的半监督网站主题分类方法HGNN...
关键词:网站主题 异构图神经网络 半监督 特征融合 
数字化时代高校网络舆情主题分类研究——以新浪微博为例
《中国管理信息化》2023年第21期158-164,共7页贾隆嘉 
吉林省社会科学基金博士和青年扶持项目“基于多特征融合的关键词提取方法及其在教育大数据中的应用”(2023C77);中央高校基本科研业务费“学科建设绩效评价与绩效监管体系探究”(1909229)。
通过一种文本表示策略解决新浪微博主题分类研究所面临的特征权重表示不准确、模型解释性不强的问题。【方法/过程】采取“选择前预测”构建特征加权向量,在训练集上通过交叉验证方式对特征加权向量的成效进行评价,选择最好评估结果对...
关键词:网络舆情 主题分类 文本表示策略 机器学习 
基于Web日志挖掘的网络用户行为交互式可视化分析
《延安大学学报(自然科学版)》2023年第3期78-85,共8页刘翼 高明 田亮亮 严都力 韦雨萌 李凯茵 张博欣 
国家自然科学基金项目(61962059);陕西省教育厅自然科学专项(22JK0622);延安市科技计划项目(2022SLGYGG-007);陕西省大学生创新创业计划项目(S202010719023,S202010719099);延安大学大学生创新创业计划项目(D2020045)。
高校在校大学生用户群体的网络行为分析是一个有着普遍需求和意义的重要课题,具有丰富的现实意义与社会价值。本文提出网络用户行为交互式可视化分析方法,研究分析高校大学生用户群体网络行为的特征和兴趣。首先获取某高校真实的网络用...
关键词:交互式可视化分析 网页日志挖掘 网络用户行为 主题分类 高校学生 
开放公文主题分类自动标注方法(摘编)
《中国档案》2023年第3期71-71,共1页卢小宾 鲁国轩 杨冠灿 祁天娇 
文章针对大规模政府开放公文的主题分类标注问题,提出一种基于多分类模型的政府开放公文主题分类自动标注方法。第一,公文主题分类标注的需求。针对主题分类标注不一致问题。开放公文所涉领域广泛,可以采用预训练模型(如BE RT)对公文提...
关键词:文本分类 主题分类 词向量 多分类模型 不一致问题 公文 全文本 一致性 
政府网站开放公文主题分类自动标注方法
《复印报刊资料(档案学)》2022年第6期43-50,共8页卢小宾 鲁国轩 杨冠灿 祁天娇 
国家社会科学基金重点项目“新时期产业技术情报分析方法体系研究”(21ATQ008)。
当前,政府从各层面采取了一系列措施推进政务信息公开,已经取得了阶段性成果。实践工作中,政府网站平台发布的开放公文缺少主题分类、标注不一致问题成为阻碍政务信息开放利用的技术瓶颈。如何精准地、一致地对现有政府平台的海量政务...
关键词:政策文本 主题分类 预训练BERT模型 标注方法 
基于文本挖掘增强的画像系统设计与实现被引量:1
《工业控制计算机》2022年第10期91-94,97,共5页谢莹庆 曹炳尧 熊义龙 
国家重点研发计划(2021YFB2900800);上海市科委项目(20511102400、20ZR1420900)。
基于用户的网络行为数据进行画像分析,有益于解决因海量信息导致的难以精准了解用户喜好及需求的问题。以用户在涉及眼科医疗领域的互联网浏览行为为分析对象,对用户阅读内容进行文本挖掘,通过词向量模型构建、特征选择、主题分类等环节...
关键词:用户画像 文本挖掘 词向量模型 特征选择 主题分类 
一种用于垃圾评论分类的融合主题信息的生成对抗网络模型被引量:2
《小型微型计算机系统》2021年第11期2292-2299,共8页徐闽樟 陈羽中 
国家自然科学基金项目(61672158,61672159,61502104,61502105)资助;福建省高校产学合作项目(2018H6010)资助;福建省科技引导项目(2017H001)资助;福建省自然科学基金项目(2017J01752,2018J01795)资助.
随着信息时代的飞速发展,由此也衍生出刷垃圾评论等黑色产业.随着机器学习技术的兴起,人们研究出许多有效的方法来识别垃圾评论.传统统计机器学习方法通过人工特征工程提取能够区分垃圾评论和正常评论的评论类别特征,往往需要花费大量...
关键词:垃圾评论分类 生成对抗神经网络 主题分类 半监督学习 强化学习 
一种基于主题分类与语义相似度的专利推荐算法
《无线互联科技》2021年第21期105-107,共3页刘伟 杨尚伟 林晨炜 万昀烨 陈善雄 
重庆市技术创新与应用发展专项.项目编号:cstc2020jscx-msxm X0187;重庆市级科研院所绩效激励引导专项.项目编号:cstc2020jxj10131。
文章提出了一种基于主题分类与语义相似度的专利推荐算法。该算法通过引入神经网络Bert,将专利标题及摘要进行关键词提取与词向量转换,使用DBSCAN聚类方法根据词向量构建专利主题领域类别,与文本相似度框架SimNet结合构成一个整体分析模...
关键词:TF-IDF Bert网络模型 SimNet框架 专利推荐 
金融机构海量投诉数据分析与应用——基于LDA-TPA模型文本挖掘被引量:1
《金融发展评论》2021年第9期81-95,共15页毛泽强 
近年来伴随新媒体的不断发展,金融服务行业的投诉话题极易暴露在社会公众视角下,成为舆论关注与讨论的焦点。据2020年金融监管部门投诉公开数据显示,金融领域投诉量正在以两位数逐年增长,如何有效挖掘海量投诉文本价值,洞悉投诉关注的...
关键词:文本挖掘 主题分类 相似度分析 趋势分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部