中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-10
视图:
排序:
简单且有效的弱监督中文文本分类算法
《计算机工程与应用》2025年第4期192-210,共19页陈中涛 周亚同 
目前基于种子词的弱监督文本分类算法大多需要从数据集中搜索所有种子词并以此扩展类别词典,出现频率较低的种子词的类别识别能力也较低。因此设计了一个简单且有效的弱监督中文文本分类算法(simple and effective weakly supervised Ch...
关键词:弱监督 文本分类 自训练 种子词 
多尺度CNN卷积与全局关系的中文文本分类模型被引量:4
《计算机工程与应用》2023年第20期103-110,共8页宋中山 牛悦 郑禄 帖军 姜海 
国家民委中青年英才培养计划(MZR20007);湖北省科技重大专项(2020AEA011);武汉市科技计划应用基础前沿项目(2020020601012267);中央高校基本科研业务费专项资金(CPT22018)。
针对双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)和卷积神经网络(convolution neural network,CNN)因各自模型提取特征的局限性导致的分类准确率不高的问题,提出一种改进的双层CNN网络和引入注意力机制的BiLSTM...
关键词:文本分类 双向长短时记忆网络 卷积神经网络 注意力机制 
知识与数据驱动的多粒度中文文本情感分析被引量:1
《计算机工程与应用》2023年第15期177-186,共10页刘忠宝 王宇飞 
福建省社会科学基金(FJ2022A018);山西省研究生创新项目(2020SY397)。
近年来,中文文本情感分析研究取得了长足进步,但鲜有研究从语言间的差异性、领域知识的有效性和下游任务需求等方面进行探讨。鉴于此,针对中文文本的特殊性以及情感分析的实际需求,将情感知识三元组通过TransE模型得到的知识向量与双向...
关键词:中文文本 知识图谱 多粒度语义特征 情感分析 
基于PDC编码的中文文本压缩算法被引量:1
《计算机工程与应用》2015年第17期205-209,227,共6页曾党泉 
针对中文文本结构的特点以及传统压缩算法对中文文本压缩的不足,提出并实现了一个基于PDC编码的中文文本压缩算法。该算法采用的是字典压缩方式。根据单个汉字在中文文本出现的概率,采用Huffman编码方式进行前缀变长编码;定义由某个汉...
关键词:中文文本 压缩算法 前缀 深度 编码 压缩率 
中文文本压缩的LZW算法被引量:9
《计算机工程与应用》2014年第3期112-116,共5页陈庆辉 陈小松 韩德良 
中南大学自由探索计划(No.201011200121)
结合中文文本中的汉字编码方式、大字符集以及重复字串不长三个不同于英文文本的结构特点对LZW算法从读取数据方式、基本码集和字典码值输出方式三方面进行了修改。改进后的算法对中文文本的压缩比平均比LZW19提高了19%且压缩和解压速...
关键词:中文文本 数据压缩 压缩算法 编码 LZW 
多级中文文本情感分类算法研究
《计算机工程与应用》2012年第33期132-135,152,共5页邢玉娟 李恒杰 曹晓丽 张成文 
甘肃省教育厅基金项目(No.1113-01);甘肃联合大学科研高水平成果项目(No.2011GSP01)
针对文本情感分类准确率不高的问题,提出基于CCA-VSM分类器和KFD的多级文本情感分类方法。采用典型相关性分析对文档的权重特征向量和词性特征向量进行降维,在约简向量集上构建向量空间模型,根据模型之间的差异度设计VSM分类器,筛选出...
关键词:文本情感分类 核FISHER判别 支持向量机 向量空间模型 相关性分析 
面向中文文本的玉米病虫害本体学习研究被引量:4
《计算机工程与应用》2011年第20期206-209,共4页齐红 官莹莹 刘亚波 
国家自然科学基金(No.60773099;No.60873149;No.60973088);国家863高技术研究发展计划项目(No.2006AA10Z245;No.2006AA10A309);中央高校基本科研业务费专项资金(No.200903181;No.200903192)~~
由于中文和英文在语法和句法等方面的差异,面向中文文本的本体学习方法尚存在一定困难。研究了面向中文文本的玉米病虫害本体学习方法。提出单字合并法,将其与TFIDF方法结合,进行概念抽取;将欧几里德距离与余弦距离加权平均计算概念相似...
关键词:本体学习 概念抽取 概念关系抽取 玉米病虫害本体 
一种基于中心文档的KNN中文文本分类算法被引量:17
《计算机工程与应用》2011年第2期127-130,共4页鲁婷 王浩 姚宏亮 
国家自然科学基金(No.60705015);安徽省自然科学基金(No.070412064);合肥工业大学科学研究发展基金项目(No.070504F)~~
在浩瀚的数据资源中,为了实现对特定主题的搜索或提取,文本自动分类技术已经成为目前研究的热点。KNN是一种重要的文本自动分类方法,KNN能够处理大规模数据,且具有较高的稳定性,但面临分类速度较慢的问题。以KNN方法为基础,引入特征项...
关键词:中文文本分类 k最邻近 中心文档 语义相似度 聚类 
中文文本分类中利用依存关系的实验研究被引量:16
《计算机工程与应用》2010年第3期131-133,141,共4页王鹏 樊兴华 
国家自然科学基金No.60703010;重庆市自然科学基金 No.2006BB2374;重庆市教委科学技术研究项目(No.KJ070519);教育部回国留学人员启动基金(教外司留[2007]1109号~~
为了利用依存关系进行短文本分类,研究了利用依存关系进行短文本分类存在的四个关键问题。分别在长文本语料集和两个短文本语料集上,抽取具有依存关系的词对,并利用这些词对作为特征进行分类实验。实验结果表明:依存关系能够作为有效的...
关键词:依存关系 短文本 文本分类 
面向中文文本分类的C4.5Bagging算法研究被引量:2
《计算机工程与应用》2009年第26期135-137,共3页张翔 周明全 耿国华 侯凡 
国家自然科学基金No.60573179~~
对于中文文本分类问题,提出一种新的Bagging方法。这一方法以决策树C4.5算法为弱分类器,通过实例重取样获取多个训练集,将其结果按照投票规则进行合成,最终得到分类结果。实验证明,这种算法的准确率、查全率、F1值比C4.5、kNN和朴素贝...
关键词:BAGGING算法 C4.5算法 中文文本分类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部