中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=中文信息学报x
条 记 录,以下是1-10
视图:
排序:
基于多层级语言特征融合的中文文本可读性分级模型
《中文信息学报》2024年第5期41-52,共12页谭可人 兰韵诗 张杨 丁安琪 
国家自然科学基金(62137001);教育部语合中心重点项目(21YH21B);教学资源建设重点项目(YHJC22ZD067);华东师范大学新中文教育专项课题(2022ECNU-WHCCYJ-29,2022ECNU-WHCCYJ-31)。
中文文本可读性分级任务的目标是将中文文本按照其可读性划分到相应的难度等级。近年来研究表明,语言特征与深度语义特征在表征文章难度上体现出互补性。但已有的工作仅对两类特征进行浅层融合,尚未考虑将语言特征和深度模型进行深层、...
关键词:中文文本可读性分级 多层级特征融合 深度模型 
字里行间的道德:中文文本道德句识别研究
《中文信息学报》2024年第2期132-141,154,共11页彭诗雅 刘畅 于东 邓雅月 
教育部人文社科一般项目(23YJAZH184);北京语言大学梧桐创新平台(中央高校基本科研业务费专项资金)(21PT04)。
随着人工智能的发展,越来越多的研究开始关注人工智能伦理。与英文相比,目前面向中文的道德研究开展缓慢,其中一个主要难点是数据短缺问题,且由于理论基础和思维方式等诸多差异,使得英语中的道德识别研究难以直接迁移到中文里,影响了中...
关键词:人工智能伦理 机器道德 文本道德 
中文文本自动校对综述被引量:1
《中文信息学报》2022年第9期1-18,27,共19页李云汉 施运梅 李宁 田英爱 
国家重点研发计划项目(2018YFB1004100)。
文本校对在新闻发布、书刊出版、语音输入、汉字识别等领域有着极其重要的应用价值,是自然语言处理领域中的一个重要研究方向。该文对中文文本自动校对技术进行了系统性的梳理,将中文文本的错误类型分为拼写错误、语法错误和语义错误,...
关键词:自动校对 拼写错误 语法错误 语义错误 数据集 评估指标 
基于粗糙集和多通道词向量的中文文本情感特征分析被引量:3
《中文信息学报》2020年第8期94-104,共11页陈波 谢珺 苗夺谦 王雨竹 续欣莹 
山西省应用基础研究项目(201801D221190,201801D121144)。
粗糙集是一种能够有效处理不精确、不完备和不确定信息的数学工具,粗糙集的属性约简可以在保持文本情感分类能力不变的情况下对文本情感词特征进行约简。针对情感词特征空间维数过高、情感词特征表示缺少语义信息的问题,该文提出了RS-W...
关键词:属性约简 情感特征提取 词向量 情感分类 
基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究被引量:12
《中文信息学报》2020年第4期101-110,共10页程勇 徐德宽 董军 
教育部人文社会科学研究一般项目(19YJCZH016)
文本阅读难度自动分级是让计算机能够根据文本特征自动判断文本所属的难度级别,该文以此为目标,提出一种基于多元语言特征与深度特征相融合的方法来实现对文本难度的自动分级。其中多元语言特征考虑了汉字、词汇、句子等不同的语言层面...
关键词:语言特征 深度特征 阅读难度分级 
融合卷积神经网络与层次化注意力网络的中文文本情感倾向性分析被引量:25
《中文信息学报》2019年第1期133-142,共10页程艳 叶子铭 王明文 张强 张光河 
国家自然科学基金(61262080;61562043);江西省科技重点项目(20151BBE50121;20161BBE50086);江西省教育厅科技重点项目(GJJ150299)
文本情感倾向性分析是自然语言处理研究领域的一个基础问题。基于深度学习的模型是处理此问题的常用模型。而当前的多数深度学习模型在中文文本情感倾向性分析方面的应用存在两个问题:一是未能充分考虑到文本的层次化结构对情感倾向性...
关键词:卷积神经网络 层次化注意力网络 情感倾向性分析 词向量 
基于CNN与双向LSTM的中文文本蕴含识别方法被引量:23
《中文信息学报》2018年第7期11-19,共9页谭咏梅 刘姝雯 吕学强 
网络文化与数字传播北京市重点实验室开放课题(ICDD201703);国家自然科学基金(61671070)
为了避免基于传统机器学习的中文文本蕴含识别方法需要人工筛选大量特征以及使用多种自然语言处理工具造成的错误累计问题,该文提出了基于CNN与双向LSTM的中文文本蕴含识别方法。该方法使用CNN与双向LSTM分别对句子进行编码,自动提取相...
关键词:中文文本蕴含 卷积神经网络 双向长短时记忆网络 
面向阅读理解的多对一中文文本蕴含问题研究被引量:4
《中文信息学报》2018年第4期87-94,共8页陈千 陈夏飞 郭鑫 王素格 
国家863计划项目(2015AA015407);国家自然科学基金(61502288;61403238;61673248;61502287);山西省基础研究计划青年科技研究基金(201701D221101);山西省基础研究计划青年科技研究基金(201601D021076);上海市科学技术委员会科研计划项目(16JC1403000);山西省科技基础条件平台计划项目(2015091001-0102)
机器阅读理解作为一种微阅读模式近年来在自动问答领域受到广泛关注,针对机器阅读理解中多对一的文本蕴含问题,该文首先构造了8 000级别的多句—单句中文文本蕴含语料M2OCTE,其次采用了层级神经网络模型,有效融合多个句子之间的语义信息...
关键词:机器阅读理解 中文文本蕴含识别 多对一 层级神经网络 
一种基于多特征因子改进的中文文本分类算法被引量:11
《中文信息学报》2017年第4期132-137,144,共7页叶敏 汤世平 牛振东 
采用向量空间模型(vector space model,VSM)表示网页文本,通过在CHI(Chi-Square)特征选择算法中引入频度、集中度、分散度、位置信息这四个特征因子,并考虑词长和位置特征因子改进TF-IDF权重计算公式,提出了PCHI-PTFIDF(promoted CHI-pr...
关键词:文本分类 χ2统计 特征选择 TF-IDF权重计算 
中文文本的事件时空信息标注被引量:13
《中文信息学报》2016年第3期213-222,共10页张春菊 张雪英 王曙 廖建平 陈晓丹 
国家自然科学基金(41401451;40971231);国家863项目(2012AA12A403-3);中央高校基本科研业务项目(JZ2014HGBZ0064);江苏省测绘地理信息科研项目(JSCHKY201502)
基于文本数据源的地理空间信息解析研究侧重于地名实体、空间关系等空间语义角色的标注和抽取,忽略了丰富的时间信息、主题事件信息及其时空一体化信息。该文通过分析中文文本中事件信息描述的语言特点和事件的时空语义特征,基于地名实...
关键词:中文文本 时空信息 事件 标注体系 标注语料库 
检索报告 对象比较 聚类工具 使用帮助 返回顶部