文本自动分类

作品数:157被引量:1088H指数:13
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李湘东薛德军张雪英王明文王效岳更多>>
相关机构:清华大学江西师范大学武汉大学山西大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金江西省自然科学基金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于KNN算法的电子档案信息文本自动分类方法
《办公自动化》2025年第5期14-16,共3页杨易木 
文章深入探讨文本自动分类的领域,聚焦于一种广泛应用的基于内容的分类技术——KNN(K-Nearest Neighbors)算法,对其原理和应用进行重点介绍。采用KNN算法结合优化的词特征权重评估与文本相似性计算技术,实现文本的自动分类。经过KNN分...
关键词:KNN算法 文本自动分类 数据挖掘 
基于遗传算法优化支持向量机的文本自动分类方法
《信息技术与信息化》2025年第2期164-167,共4页胡翔 
在实际文本自动分类任务中,因文本的多样性和复杂性,常会遇到一些特殊的、不符合常规分类模式的文本。这些文本往往使得标引深度和标引专指度难以达到理想的平衡状态。这种不平衡导致在处理复杂模型和大规模数据时,支持向量机(SVM)模型...
关键词:遗传算法 支持向量机 文本自动分类 特征向量 优化模型参数 
企业生成内容与顾客契合——基于双重编码理论的实证研究
《软科学》2025年第1期116-122,共7页邵明星 田梦影 范静 
国家自然科学基金项目(71974018);教育部人文社会科学研究规划基金项目(22YJA630018)。
基于双重编码理论,使用新浪微博数据,研究企业生成内容的语言文字特征和多媒体特征如何影响顾客契合。研究发现:显意识内容显著唤起理性忠诚,潜意识内容更易引发情感依附;媒介丰富度有效提升情感依附;企业知名度发挥负向调节作用,低知...
关键词:社交媒体 企业生成内容 顾客契合 双重编码理论 文本自动分类 
基于大语言模型的《四库全书》自动分类研究被引量:1
《信息资源管理学报》2024年第5期23-35,共13页左亮 赵志枭 王东波 
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331)的研究成果之一。
在古籍研究掀起热潮以及古籍活化成为时代要求的背景下,古籍自动分类面临更高的要求。结合当下前沿的大语言模型,以《四库全书》史部和经部的25类语料作为输入语料,探究荀子古籍大语言系列模型在古籍自动分类上的分类效果。通过与其基...
关键词:《四库全书》 分类模型 荀子古籍大语言模型 文本自动分类 
基于改进KNN算法的档案信息文本自动分类方法研究被引量:1
《信息与电脑》2024年第4期71-73,共3页潘国炀 
常规的档案信息文本自动分类方法主要使用Bloom二维分类矩阵标注分类特征,导致分类评价指标偏低。对此,提出基于改进K最近邻(K-Nearest Neighbor,KNN)算法的档案信息文本自动分类方法,即提取档案信息文本自动分类特征,再利用改进KNN算...
关键词:档案信息 文本 自动分类 
基于LDA模型融合Catboost算法的文本自动分类系统设计与实现被引量:3
《国家图书馆学刊》2023年第5期84-92,共9页刘爱琴 郭少鹏 张卓星 
互联网的蓬勃发展使得文本数据呈指数型增长态势,如何实现文本内容的高效分类成为信息资源管理工作面临的紧要问题。本文以维普学术期刊资源与百度新闻网页作为基础语料集,基于LDA模型抽取文档主题、切分文本内容,融合集成学习Catboost...
关键词:隐含狄利克雷分布(LDA) 文本自动分类 SVM算法 Catboost算法 
基于BERT-BiGRU的中文专利文本自动分类被引量:10
《郑州大学学报(理学版)》2023年第2期33-40,共8页刘燕 
河南省高校人文社会科学研究项目(2023-ZDJH-589);河南省哲学社会科学规划年度项目(2021BZH015)。
针对中文发明专利文本的文字描述专业性强、人工分类耗时耗力等问题,提出一种基于BERT-BiGRU模型的中文专利文本自动分类方法,利用预训练的BERT模型完成对中文发明专利文本进行向量化语义表征,引入词嵌入和多头注意力机制等方法抽取专...
关键词:专利文本分类 BERT BiGRU 词嵌入 
基于CNN-BiLSTM网络的数控机床故障文本自动分类被引量:2
《计算机与现代化》2023年第4期7-14,共8页徐涯昕 何泽恩 徐绪堪 
国家社科重大基金资助项目(20&ZD125);国家级大学生创新创业训练计划项目(202110294082)。
中小数控机床企业在运营维护中积累了大量以人工文本记录的故障维修数据。为了实现高效精准分类,帮助维修人员高效开展工作,本文提出一种基于卷积神经网络和双向长短时记忆网络的故障文本分类预测方法。首先通过构建专业特征词库完成预...
关键词:文本分类 数控机床故障 卷积神经网络 双向长短时记忆网络 
基于TI-LSTM的文本自动分类算法及应用被引量:4
《长春理工大学学报(自然科学版)》2023年第1期130-136,共7页陈玉天 陈洋 梁恒瑞 孙绍宇 施三支 
吉林省教育厅项目(JJKH20210809KJ);长春理工大学大学生创新创业训练计划项目(2021019)。
为了有效解决中文文本分类问题,提高文本分类的准确性,提出一种基于TF-IDF和神经网络相结合的文本自动分类算法——TI-LSTM算法。算法根据语义情景提取相应特征,进行量化,通过长短期神经网络(LSTM)对量化后的特征进行训练并赋予权重,最...
关键词:神经网络 文本分类 特征提取 文本量化 贫困生 
结合短文本扩展和BERT的商品评论文本自动分类被引量:5
《信息资源管理学报》2023年第1期129-139,共11页李湘东 孙倩茹 石健 
针对商品评论文本具有短文本及表述用词不规范的特点,探讨如何实现商品评论文本按照商品种类进行自动归类并提高其分类效果。通过TF-IDF和LDA构建训练集的核心词集,利用Word2Vec相似度计算方式对短文本进行特征扩展获得的商品评论文本...
关键词:商品评论文本 短文本 特征扩展 Word2Vec BERT 
检索报告 对象比较 聚类工具 使用帮助 返回顶部