中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
结合依存图卷积的中文文本相似度计算研究被引量:1
《计算机工程》2025年第3期76-85,共10页胡书林 张华军 邓小涛 王征华 
湖北省重点研发计划项目(2022BAA051)。
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能...
关键词:图卷积神经网络 依存句法分析 动态词嵌入 文本相似度 注意力机制 
基于矫正理解的中文文本对抗样本生成方法被引量:2
《计算机工程》2023年第2期37-45,共9页王春东 孙嘉琪 杨文军 
国家自然科学基金联合基金项目(U1536122);国家重点研发计划“科技助力经济2020”重点专项(SQ2020YFF0413781);天津市科委重大专项(15ZXDSGX00030);天津市教委科研计划(2021YJSB252)。
自然语言处理技术在文本分类、文本纠错等任务中表现出强大性能,但容易受到对抗样本的影响,导致深度学习模型的分类准确性下降。防御对抗性攻击是对模型进行对抗性训练,然而对抗性训练需要大量高质量的对抗样本数据。针对目前中文对抗...
关键词:深度神经网络 自然语言处理 文本分类 对抗样本 矫正理解 
基于改进BiGRU-CNN的中文文本分类方法被引量:16
《计算机工程》2022年第5期59-66,73,共9页陈可嘉 刘惠 
国家自然科学基金(71701019)。
传统的自注意力机制可以在保留原始特征的基础上突出文本的关键特征,得到更准确的文本特征向量表示,但忽视了输入序列中各位置的文本向量对输出结果的贡献度不同,导致在权重分配上存在偏离实际的情况,而双向门控循环单元(BiGRU)网络在...
关键词:自注意力机制 双向门控循环单元 多通道卷积神经网络 文本分类 深度学习 
融合外部语义知识的中文文本蕴含识别被引量:1
《计算机工程》2021年第1期44-49,共6页李世宝 李贺 赵庆帅 殷乐乐 刘建航 黄庭培 
国家自然科学基金(61972417,61872385);中央高校基本科研业务费专项资金(18CX02134A,19CX05003A-4,18CX02137A)。
基于神经网络的文本蕴含识别模型通常仅从训练数据中学习推理知识,导致模型泛化能力较弱。提出一种融合外部语义知识的中文知识增强推理模型(CKEIM)。根据知网知识库的特点提取词级语义知识特征以构建注意力权重矩阵,同时从同义词词林...
关键词:中文文本蕴含 自然语言推理 注意力机制 双向长短期记忆网络 知网 词林 
基于改进TextRank算法的中文文本摘要提取被引量:25
《计算机工程》2019年第3期273-277,共5页徐馨韬 柴小丽 谢彬 沈晨 王敬平 
国家部委基金
为提高中文文本摘要提取的准确度,融合Doc2Vec模型、K-means算法和TextRank算法,提出一种中文文本摘要自动提取算法(DK-TextRank)。使用Doc2Vec模型进行文本向量化,采用改进的K-means算法实现相似文本聚类,在每个聚类簇中应用加入权重...
关键词:Doc2Vec模型 K-MEANS算法 TextRank算法 摘要提取 权重影响因子 
基于VDCNN与LSTM混合模型的中文文本分类研究被引量:10
《计算机工程》2018年第11期190-196,共7页彭玉青 宋初柏 闫倩 赵晓松 魏铭 
河北省自然科学基金重点项目(F2016202144);河北省自然科学基金面上项目(F2017202145)
自然语言在结构上存在一定的前后依赖性,且将中文文本直接转化为向量时会使维度过高,从而导致现有文本分类方法精度较低。为此,建立一种超深卷积神经网络(VDCNN)与长短期记忆网络(LSTM)相结合的混合模型。通过VDCNN的深度结构来提取文...
关键词:文本分类 卷积神经网络 长短期记忆网络 词嵌入 深度残差网络 
基于概念聚类的领域本体图中文文本分类被引量:2
《计算机工程》2016年第12期181-187,共7页叶施仁 孙宁 
国家自然科学基金(61272367)
基于半监督概念聚类技术,提出一种改进的领域本体图中文文本分类算法。根据领域本体图结构模型,创建中文文本分类的本体学习框架,利用HowNet字典实现术语提取并建立中文术语-术语关系映射。依据术语间的权重连接关系,设计二分类关系的KL...
关键词:词消歧 半监督 概念聚类 HowNet字典 二分类关系 领域本体图 
基于击键动力学的中文自由文本持续认证方法被引量:4
《计算机工程》2016年第1期138-144,149,共8页黄怡然 胡晓勤 
针对中文输入的特点以及用户的击键韵律,基于曼哈顿距离,提出一种中文自由文本持续认证方法,对所有采用中文输入的用户在使用社交软件聊天时进行持续认证。实验结果显示,该方法有效控制了错误拒绝率、错误接受率与相等错误率,可以在用...
关键词:持续认证 击键动力学 中文文本 错误接受率 错误拒绝率 相等错误率 
中文文本的意群分类算法
《计算机工程》2013年第8期204-207,214,共5页李志彤 易军凯 
国家"863"计划基金资助重点项目(2009AA01Z433)
目前中文文本分类算法大多利用词语或词语映射为特征项的分类方式,未考虑中文语法语义的特点,导致分类性能较低。为此,提出中文文本的意群分类算法。通过中文依存句法分析结果制定规则提取意群,并作为特征项表示文本,进而采用支持向量...
关键词:文本分类 意群 支持向量机 语义概念 依存句法 类别意群库 
基于知识库的多层级中文文本查错推理模型被引量:10
《计算机工程》2012年第20期21-25,共5页吴林 张仰森 
国家自然科学基金资助项目(60873013;61070119);北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1005);北京市属市管高等学校人才强教计划基金资助项目(PHR201007131)
以往的中文文本查错研究主要针对字词错误,对句法、语义的错误推理研究不够。为此,利用统计模型和大规模人民日报语料库构建并扩充查错知识库,针对文本中字词、语法以及语义3个层次的错误,提出相应的多层级查错推理模型。设计并实现3个...
关键词:中文文本 知识库 多层级查错 查错推理 语义查错 
检索报告 对象比较 聚类工具 使用帮助 返回顶部