中文文本

作品数:737被引量:4133H指数:27
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘怀亮张雪英张顺香张仰森张春菊更多>>
相关机构:北京邮电大学华南理工大学清华大学西安电子科技大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家教育部博士点基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 主题=文本x
条 记 录,以下是1-10
视图:
排序:
中文文本适读性评估特征体系研究——基于语言认知的可解释性视角
《语言文字应用》2025年第1期100-113,共14页杨丽姣 徐会丹 宋培彦 
国家社科基金一般项目“基于文本适读性智能评估方法的汉语儿童阅读资源体系构建研究”(23BYY198)支持。
在国际中文教育数字化应用快速发展的背景下,阅读材料量化分析与智能评估的需求日益增长。本研究基于《国际中文教育中文水平等级标准》的等级框架,融合语料库方法与自然语言处理技术,从语言认知的可解释性出发,设计并构建了一种适用于...
关键词:文本适读性 特征体系 认知可解释性 语料库方法 自然语言处理技术 
基于中文文本相似度评估的情感勒索话语检测系统
《计算机应用研究》2024年第10期3073-3080,共8页林文晟 杨观赐 钟世昊 
国家自然科学基金资助项目(62373116,62163007);贵州省科技计划资助项目(黔科合支撑[2023]一般118,黔科合平台人才[2020]6007-2)。
情感勒索是通过情感压力迫使周围人听从自己要求的交流方式,容易导致对方的负面情绪甚至心理问题从而影响交流效果。为了检测日常交流场景下的情感勒索话语进而改善交流效果,开发了基于中文文本相似度评估的情感勒索话语检测系统。首先...
关键词:智能系统 情感勒索话语检测 文本表达方式 相似度评估 
中文文本去毒任务的研究
《山西大学学报(自然科学版)》2024年第3期528-538,共11页刘江盛 左家莉 胡玉婷 万剑怡 王明文 
国家自然科学基金(61866018)。
文章旨在研究如何有效去除中文文本的毒性。针对此任务,文章重构了一个中文毒性语料集,以此作为任务研究的数据基础。基于此数据集文章探究了文本的毒性表现形式,同时对特定类别的毒性文本成因展开了分析。基于上述分析结果,文章使用基...
关键词:文本风格迁移 文本去毒 大语言模型 
字里行间的道德:中文文本道德句识别研究
《中文信息学报》2024年第2期132-141,154,共11页彭诗雅 刘畅 于东 邓雅月 
教育部人文社科一般项目(23YJAZH184);北京语言大学梧桐创新平台(中央高校基本科研业务费专项资金)(21PT04)。
随着人工智能的发展,越来越多的研究开始关注人工智能伦理。与英文相比,目前面向中文的道德研究开展缓慢,其中一个主要难点是数据短缺问题,且由于理论基础和思维方式等诸多差异,使得英语中的道德识别研究难以直接迁移到中文里,影响了中...
关键词:人工智能伦理 机器道德 文本道德 
基于相似度融合的中文文本相似性度量方法研究被引量:2
《信息技术与信息化》2023年第10期36-39,共4页温雨 王琦 严武军 
山西省高等学校教学改革创新项目(JG20220980)。
中文文本之间可能具有复杂的上下文关系,比较容易出现语义混淆、语序混乱等问题,而使用传统的度量文本相似性的方法很难捕捉到这些关系,所以对于中文文本的结构特点等造成度量中文文本相似性存在的不足,采用了一种基于相似度融合的方式...
关键词:相似度融合 文本相似性 字面特征 语义特征 对比实验 层次分析法 
基于文本关键词的对抗样本生成技术研究被引量:2
《信息安全研究》2023年第4期338-346,共9页王志强 都迎迎 林雨衡 陈旭东 
中国博士后科学基金面上项目(2019M650606);信息网络安全公安部重点实验室项目(C9614);广东省信息安全技术重点实验室开放课题基金项目(2020B1212060078-12);北京电子科技学院一流学科建设项目(3201012)。
深度学习模型已被广泛应用于处理自然语言任务,但最新研究表明对抗攻击会严重降低分类模型的准确率,使模型分类功能失效.针对深度学习模型处理自然语言任务时出现的脆弱性问题,提出一种新的对抗样本生成方法KeywordsAttack.该方法利用...
关键词:对抗样本 中文文本 神经网络 黑盒攻击 深度学习 
基于TF-IDF和word2Vec的中文文本自动摘要模型被引量:6
《中国新通信》2023年第2期65-67,共3页龚永罡 郭远南 
随着互联网时代的数据爆炸,在短文本信息数量迅速增长的环境下,为了更好地进行中文本摘要模型的计算,本文针对短文本的文本特征提取和相似度计算进行了深入研究。本文将优化的TF-IDF模型和Word2Vec模型结合起来,进而提出一种兼顾短文本...
关键词:文本特征 相似度 Word2Vec TF-IDF 余弦相似度 
基于KenLM的中文文本纠错算法研究
《电信工程技术与标准化》2022年第11期46-50,共5页李岩 杜刚 张晨 朱艳云 
日常生产生活中会面临大量文本创作需求,在进行文本创作时,难免会出现错字、缺字等情况。为了避免最终呈现版本出现错字、缺字等情况,往往需要耗费大量时间在文本纠错上。为了提升纠错效率,进而提升整体的文本创作质量,本文提出了一种基...
关键词:自然语言处理 文本纠错 KenLM N-GRAM 
优化预训练模型的小语料中文文本分类方法被引量:1
《现代计算机》2022年第16期1-8,15,共9页陈蓝 杨帆 曾桢 
教育部产学合作协同育人项目(BZX1902-20):基于Jupyter Notebook的用户信息行为分析整合实验教学设计。
针对GloVe、BERT模型生成的字向量在小语料库中表义不足的问题,提出融合向量预训练模型,对小语料中文短文本分类的精确度进行提升。本文以今日头条新闻公开数据集为实验对象,使用GloVe、BERT模型通过领域预训练,对GloVe与BERT生成的预...
关键词:BERT GLOVE 向量融合 小语料 短文本 
面向规范性文件的基于BERT的文本纠错模型被引量:4
《山西大学学报(自然科学版)》2022年第2期257-263,共7页汪苏琪 王明文 曾雪强 
国家自然科学基金(61866017;61866018;61876074;61966019);江西省自然科学基金(20192BAB207027)。
针对行政规范性文件的文本纠错任务,提出了基于BERT(Bidirectional Encoder Representations from Transformers)的文本纠错模型,模型针对冗余、缺失、错序、错字四类任务分别建模,分为检错和纠错两个阶段。检错阶段检查出文本是否有错...
关键词:中文文本纠错 行政规范性文件 BERT BiLSTM 条件随机场 
检索报告 对象比较 聚类工具 使用帮助 返回顶部