词性标记

作品数:14被引量:79H指数:6
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:余正涛戴祖旭高盛祥洪帆文永华更多>>
相关机构:昆明理工大学华中科技大学电子科技大学武汉工程大学更多>>
相关期刊:《中文信息学报》《系统工程理论与实践》《计算机工程与应用》《重庆工商大学学报(自然科学版)》更多>>
相关基金:湖北省自然科学基金国家自然科学基金国家高技术研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于多特征融合的中文文本分类研究被引量:6
《数据分析与知识发现》2021年第10期1-14,共14页王艳 王胡燕 余本功 
国家自然科学基金项目(项目编号:71671057)的研究成果之一。
【目的】通过结合拼音字符特征、汉字字符特征、词级别语义特征和词性特征,缓解文本所呈现出的弱结构化、拼写错误及其同音词较多的问题,丰富语义特征,提高模型的分类能力。【方法】多特征融合的文本分类方法,在词级别特征的基础上进行...
关键词:词性标记 词级别特征 文本分类 拼音字符特征 汉字字符特征 
面向实体标注的军事语料库建设被引量:7
《计算机科学》2019年第B06期540-546,共7页周彬彬 张宏军 张睿 冯蕴天 徐有为 
军事语料的识别和标注是军事语料库建设的关键。针对军事语料的实体,提出了一套统一的军语词性标记规范和军事语料标注规范,设计了一种基于军语词典的自动扩展的军事语料实体特征提取框架。该框架借助设计的高精分类器进行基本特征的选...
关键词:军事实体标注 军语词性标记 特征提取 军事语料库 
不同词性标记集在典籍实体抽取上的差异性探究被引量:13
《数据分析与知识发现》2019年第3期57-65,共9页袁悦 王东波 黄水清 李斌 
国家社会科学基金重大项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:15ZDB127);国家自然科学基金面上项目"基于典籍引得的句法级汉英平行语料库构建及人文计算研究"(项目编号:71673143)的研究成果之一
【目的】在数字人文这一背景下,为更加深入和精准地从古代典籍中挖掘相应的知识,通过实验对比分析,探究不同词性标记集在典籍实体抽取上的差异性。【方法】基于已完成人工校验和机器自动标注的《左传》与《国语》构成的训练和测试语料,...
关键词:数字人文 古文信息处理 词性标注 命名实体抽取 
引入词性标记的基于语境相似度的词义消歧被引量:6
《中文信息学报》2018年第8期9-18,共10页孟禹光 周俏丽 张桂平 蔡东风 
教育部人文社会科学研究规划基金(18YJA870020)
目前的语境向量模型在对语义空间建模的时候,没有考虑到同一个词的不同词性具有不同的含义,将它们看作同一个点进行建模,导致得到的语境向量质量不高,使用这种语境向量计算语境相似度效果不好。针对该类问题,提出了一种加入词性特征的...
关键词:语境向量 语境相似度 词义消歧 词性特征 
高等师范学校古代汉语教学语料库建设
《价值工程》2011年第22期264-265,共2页张统宣 
渭南师范学院科研基金资助项目11YKS010
建设基于高等师范学校古代汉语教学的古代汉语语料库,可以为高等师范学校汉语言文学专业古代汉语教学中教学实践、教材编写、试题编写等工作提供可靠、科学的数据。文章就语料库的语料选取、词性标记规范的设定、语料库应用进行了阐述。
关键词:古代汉语 语料库 词性标记 统计 检索 
语法错误的浅层分析检查
《重庆工商大学学报(自然科学版)》2010年第2期130-133,共4页谢坤武 
湖北省教育厅项目(2008297)
随着计算机和互联网的迅速发展,成千上万的用户每天日常工作中都必须用英语写作、交流,对于母语不是英语的用户来说,英语写作是一大障碍;语法检查的技术起源于自然语言理解的应用,本文介绍了常见的语法错误类型进行了分类,尤其是分析了...
关键词:语法错误 浅层分析 转换网络 词性标记 数据库 
结合词性分析与串频统计的词语提取方法被引量:19
《系统工程理论与实践》2010年第1期105-111,共7页于娟 党延忠 
国家高技术研究发展计划(863计划)(2008AA04Z107)
在介绍分析现有主要提词方法的基础上,提出并实现了一种结合词性分析与串频统计的词语提取方法.文章首先详细描述了该方法的原理与框架,同时结合实例说明了其实现过程.然后将该方法与已有的具代表性的文本提词方法作计算结果的对比分析...
关键词:文本自动处理 词语提取 原子词 合成词 词性标记 
抵抗同义词替换攻击的文本信息隐藏算法
《四川大学学报(工程科学版)》2009年第4期186-190,共5页戴祖旭 常健 陈静 
湖北省教育厅科学技术研究项目(D20081506);武汉工程大学校长基金资助项目
为利用自然语言的词性标记实现文本信息隐藏,研究了词性标记串的序关系及其变换性质。在词性标记集上定义适当的偏序关系,通过计算标记串逆序数的奇偶性,可将标记串映射为0或1。研究了随机标记串序列对应的二进制序列的自相关性和互相关...
关键词:文本处理 信息隐藏 词性标记 逆序数 
基于Huffman编码的文本信息隐藏算法被引量:1
《计算机工程》2007年第15期147-148,151,共3页戴祖旭 洪帆 董洁 
湖北省自然科学基金资助项目(2005ABA243)
自然语言句子可以变换为词性标记串或句型。该文提出了基于句型Huffman编码的信息隐藏算法,根据句型分布构造Huffman编码,秘密信息解码为句型。句型在载体文本中的位置是密钥,对句型作Huffman压缩编码即可提取秘密信息,给出了信息隐藏...
关键词:HUFFMAN编码 词性标记 句型 文本信息隐藏 
基于词性标记序列逆序数的文本信息隐藏算法被引量:4
《计算机工程与应用》2007年第14期160-161,198,共3页戴祖旭 洪帆 
湖北省自然科学基金(No.2005ABA243)~~
文本信息隐藏技术可应用于数字媒体版权和完整性保护。自然语言文本经词性标注处理后变换为词性标记序列,提出了利用序列逆序数奇偶性隐藏信息的算法。证明了逆序数奇偶性在序列符号对换、增加和删除变换下的性质。根据隐藏信息的要求,...
关键词:文本信息隐藏 词性标注 序列逆序数 
检索报告 对象比较 聚类工具 使用帮助 返回顶部