中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机应用与软件x
条 记 录,以下是1-10
视图:
排序:
基于Graph Attention的双通道中文文本摘要生成
《计算机应用与软件》2024年第4期159-164,241,共7页曹渝昆 徐越 
国家自然科学基金项目(61802249)。
传统的中文生成式摘要方法未充分考虑中文文本字特征和词特征之间的不同含义,容易对原文内容的信息做出错误理解。提出一种基于Graph Attention的双通道中文文本摘要生成方法,采用双通道的编码器结构分别提取文本的字级和词级特征,并通...
关键词:文本摘要 注意力机制 生成式摘要 
基于注意力机制与端到端的中文文本纠错方法被引量:4
《计算机应用与软件》2022年第6期141-147,共7页王匆匆 张仰森 黄改娟 
国家自然科学基金项目(61772081,61602044);科技创新服务能力建设-科研基地建设-北京实验室-国家经济安全预警工程北京实验室项目(PXM2018_014224_000010)。
在中文文本纠错任务上,基于神经机器翻译的文本纠错模型已经取得最优表现。提出一种复制机制的纠错模型,它复制待纠错句子中的字词到目标生成文本中。由于中文文本纠错缺乏大量的标注数据,使用降噪自动编码器在大规模非标注中文语料库...
关键词:神经机器翻译 文本纠错 降噪自动编码器 预训练 
中文文本中的个人信息自动化检测框架研究被引量:2
《计算机应用与软件》2022年第2期307-314,共8页贾昊阳 盛毅敏 阮雯强 韩伟力 
国家自然科学基金项目(U1836207);上海市创新行动计划项目(18511103600)。
为帮助数据持有者规避法律风险,有必要对数据集中的个人信息做检测和统计。然而当前尚缺有效工具支持检测中文数据集中的个人信息。为应对上述问题,根据法律文献整理出需要检测的个人信息类别,提出综合了模式匹配与自然语言处理技术的...
关键词:个人信息 隐私检测 自动化 
基于双向时间深度卷积网络的中文文本情感分类被引量:14
《计算机应用与软件》2019年第12期225-231,共7页韩建胜 陈杰 陈鹏 刘杰 彭德中 
国家自然科学基金青年基金项目(61602329);四川省科技基础条件平台项目(2018TJPT0031);川大-泸州战略合作项目(2017CDLZ-G25);四川大学—自贡市校地科技合作专项资金项目(2018CDZG-10)
普通时间卷积网络对文本进行单向特征提取不能充分捕捉文本特征,对文本的分析能力较弱。提出一种基于双向时间卷积网络(Bi TCN)的情感分析模型。模型使用单向多层空洞因果卷积结构分别对文本进行前向和后向特征提取,将两个方向的序列特...
关键词:情感分析 自然语言处理 空洞卷积 因果卷积 双向时间卷积网络 
基于双向GRU神经网络和双层注意力机制的中文文本中人物关系抽取研究被引量:24
《计算机应用与软件》2018年第11期130-135,189,共7页张兰霞 胡文心 
上海市经济和信息化委员会项目(201602024)
实体关系抽取是知识抽取的重要组成部分。与传统模式识别的方法相比,深度学习的方法在关系抽取任务中表现得更为突出。目前关于中文的关系抽取技术的研究主要是基于核函数和远程监督的方法,而且数据集中的噪音数据对实验结果带来的负面...
关键词:中文关系抽取 双向GRU神经网络 注意力机制 字向量 
一种基于类别强信息特征和贝叶斯算法的中文文本分类器被引量:5
《计算机应用与软件》2014年第8期330-333,共4页陈艳秋 孙培立 
为了提高中文文本分类的效率与精度,设计一种新型的分类器。该分类器采用基于语料库的正向扫描统计分词。在词频统计阶段,采取训练阶段的按类别统计和测试阶段的按文章不同区域统计的方法;为了更好地选择特征词,提出了频度、集中度、相...
关键词:中文文本分类 特征选择 特征权重 分类算法 
一种新的Web中文文本聚类方法研究被引量:3
《计算机应用与软件》2013年第12期222-225,287,共5页叶宇飞 安世全 代劲 
传统的文本聚类缺少语义信息,文本的特征向量高维稀疏,忽略了Web文本的特殊性。为了解决这些问题,提出一种Web中文文本聚类方法。在基于知网(HowNet)的概念空间基础上过滤非名词,分析文本中重要词汇的语义,对标签特征集与正文特征集进...
关键词:WEB文本聚类 特征降维 知网 文本相似度 
用于中文文本分类的基于类别区分词的特征选择方法被引量:8
《计算机应用与软件》2013年第3期193-195,共3页周奇年 张振浩 徐登彩 
特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验...
关键词:文本分类 特征选择 类别区分词 信息增益 互信息 期望交叉熵 
一种新型的中文文本情感计算模型被引量:3
《计算机应用与软件》2011年第6期271-272,285,共3页徐群岭 
在对中文文本特点进行分析的基础上,提出了一种新型的情感倾向计算模型。该模型采用了改进的逐点分析方法SO-PMI(Semantic Orientation from Pointwise Mutual Information),基于词语对类别的倾向性进行分类。实验表明,该模型在汉语常...
关键词:文本倾向性分类 中文信息处理 态度分类 语义倾向 
结合粗糙集与集成学习的中文文本分类方法研究被引量:1
《计算机应用与软件》2011年第1期32-34,共3页张翔 周明全 董丽丽 闫清波 
国家自然科学基金项目(60873094)
介绍中文文本分类的流程及相关技术。在分析传统的文本特征选择不足的基础上,提出了基于粗糙集与集成学习结合的文本分类方法,通过粗糙集进行文本的特征选择,采用一种集成学习算法AdaBoost.M1来提高弱分类器的分类性能,对中文文本进行...
关键词:中文文本分类 粗糙集 集成学习 AdaBoost.M1 
检索报告 对象比较 聚类工具 使用帮助 返回顶部