文本分类器

作品数:62被引量:341H指数:10
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:李超群蒋良孝胡卫明廖湖声郑玉明更多>>
相关机构:中国地质大学(武汉)中国科学院自动化研究所北京工业大学北京航空航天大学更多>>
相关期刊:《计算机工程与设计》《信息安全与通信保密》《电脑编程技巧与维护》《山东师范大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划国家重点实验室开放基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
互联网突发事件监测信息分类方法研究
《数字制造科学》2022年第1期75-80,共6页张昱 罗年学 
国家重点研发计划资助项目(2018YFC0807000)
针对互联网突发事件监测快速响应场景下文本信息非结构化的特点,选择互联网众源突发事件文本数据,分析在突发事件监测信息分类中的朴素贝叶斯、BP神经网络、支持向量机和SGD支持向量机4种分类器的计算速度和分类效果。结果表明,支持向...
关键词:突发事件 监测信息 文本分类器 网络数据 WEB文本挖掘 
基于fastText的可视化作者归属模型
《智能计算机与应用》2021年第1期14-19,共6页李逍 顾长贵 杨雷鑫 陆祺灵 
国家自然科学基金(11875042);上海理工大学大学生创新创业计划资助项目(SH2020072)。
基于滑动窗口的方法,结合机器学习分类技术,可以判定文本的作者归属。但是此类方法需要精心挑选对应的文本特征,不同的文本特征选取可能会影响判定结果。针对以上问题,提出了一种基于快速文本分类(fastText)的文本作者归属判定模型。该...
关键词:滑动窗口 作者归属 快速文本分类器 数据增强技术 可视化 
基于大数据挖掘技术的文本分类研究被引量:6
《现代电子技术》2020年第17期126-129,共4页孟鑫淼 
文本数据具有规模大、特征维数高等特点,当前文本分类方法无法刻画文本变化特点,使得文本分类正确率低、误差大、分类时间长,为了获得理想的文本分类效果,设计基于大数据挖掘技术的文本分类方法。首先对当前文本分类的研究进展进行分析...
关键词:大规模文本数据 高维特征 大数据挖掘技术 文本分类器 分类精度 分类时间 
基于共识和分类改善文档聚类的识别信息方法被引量:6
《计算机应用》2020年第4期1069-1073,共5页王留洋 俞扬信 陈伯伦 章慧 
国家自然科学基金资助项目(61602202)。
不同的聚类算法用于设计各自的策略,然而,每种技术在执行特定数据集时都有一定的局限性。选择恰当的识别信息方法(DIM)可确保文档聚类的进行。针对这些问题提出一种基于共识和分类的文档聚类(DCCC)的DIM。首先,选择识别信息最大化聚类(C...
关键词:共识聚类 文档聚类 识别信息 簇标签 文本分类器 
中文文本分类方法研究被引量:2
《电脑知识与技术》2019年第2期242-244,共3页李凯 
由于现实生活中大多数信息被存储为文本,因此文本挖掘具有在商业上的高潜在价值。实际应用中可以从许多信息来源中挖掘知识,然而,非结构化文本仍然是最容易获得的知识来源。该文介绍了文本分类的过程以及对三种分类器的概述,并在最后对...
关键词:文本分类 文本表示 特征选择 权重 文本分类器 
基于候选链接主题边缘文本的主题爬虫研究
《山东师范大学学报(自然科学版)》2018年第4期421-426,共6页张环 
针对基于文本内容的主题爬虫算法引入过多无关特征属性以及没有考虑出现频次不同的特征属性对相关性判定影响的不足,提出一种基于候选链接主题边缘文本的主题爬虫.使用杜威十进分类法提取锚文本关键词和与锚文本关键词词义相近的网页正...
关键词:主题爬虫 候选链接 杜威十进分类法 朴素贝叶斯文本分类器 
针对能源使用概况的现状分析建模
《经贸实践》2018年第15期290-290,共1页刘光浤 孟雪 刘阳 
在本文中,以美国四大州为例,分别进行数据分析和建模以描述其总清洁能源状况,并对上述四州的发展进行预测和安排。首先进行四个州的能源概况分析,通过使用基于神经网络建立的文本分类器,将605个变量分为能源价格、支出、生产和消费四个...
关键词:文本分类器 主成分分析 能源概况 
利用开源框架构建基于深度神经网络的短文本分类器被引量:2
《四川图书馆学报》2018年第1期23-25,共3页凡迪 付玉贞 侯彤 
讨论了如何利用免费的开源代码库,快速构建基于深度神经网络的短文本分类器,可依照中文图书标题,将图书分类为文科和理工科两类。结果显示,文本分类器的准确率在测试集上的表现达91.9%。如果对开源社区的力量加以有效利用,能使图书馆行...
关键词:文本分类 深度神经网络 开源库 机器学习 情报学 
基于KNN算法的文本分类器的设计与实现被引量:1
《电脑编程技巧与维护》2016年第8期11-13,共3页熊志斌 朱剑锋 尹成国 伍振兴 
海南省自然科学基金项目资助(20166225);三亚市院地合作项目(2014YD35);海南省高等学校科学研究项目(HNKY2014-64)
KNN算法是一个常用的分类算法,具有简单易实现等优点,在数据挖掘、机器学习和模式识别等领域被广泛使用。研究了KNN算法,设计并实现了一个用于自然语言处理领域的基于KNN算法的文本分类器,分别用国际通用的语料库和实际项目的数据集进...
关键词:自然语言处理 文本分类 KNN算法 
多文本分类器组合方法
《消费电子》2014年第8期135-137,共3页申建国 王舵 王玮 
自由文本分类已经成为当前的研究热点,目前存在的文本分类算法已经很多,分类精度大多在70%以上。显然,研究存在哪些因素影响分类器的分类效果,并进一步提高当前分类算法的分类精度是十分有意义的。本文较全面地分析了分类器精度的...
关键词:文本分类 分类选举器 装袋 推进 
检索报告 对象比较 聚类工具 使用帮助 返回顶部