词性自动标注

作品数:17被引量:110H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:王东波何琳黄水清宋英华徐飞更多>>
相关机构:新疆大学山西大学南京农业大学南京大学更多>>
相关期刊:《计算机工程与应用》《计算机应用与软件》《语言与翻译》《西北民族大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金国家社会科学基金江苏省社会科学基金山西省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
面向数字人文的中国古代典籍词性自动标注研究——以SikuBERT预训练模型为例被引量:15
《图书馆论坛》2022年第6期55-63,共9页耿云冬 张逸勤 刘欢 王东波 
国家社会科学基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331);江苏省社会科学基金青年项目“人文计算视角下的先秦人物知识获取及分析研究”(项目编号:19TQC003)研究成果。
在深度学习技术和预训练语言模型不断发展背景下,文章探讨面向数字人文研究需求的古文典籍文本词性自动标注问题。以校验后的高质量《四库全书》全文语料作为训练集,构建SikuBERT预训练语言模型,在源自多领域的16部古文典籍文本上开展...
关键词:词性 自动标注 数字人文 SikuBERT 预训练技术 
基于BiLSTM-CRF模型的食品安全事件词性自动标注研究被引量:15
《情报学报》2018年第12期1204-1211,共8页徐飞 叶文豪 宋英华 
国家社会科学基金重大项目"基于情报流知识库的我国食品安全技术支撑体系优化策略研究"(15ZDB168);江苏省社会科学基金项目"江苏佛造像数字化保存及知识挖掘研究"(18TQB010)
词性自动标注的准确率和召回率直接影响到后续食品安全事件各个层面知识和应对策略挖掘的整体效果,不仅直接影响食品安全事件中术语、实体抽取的性能,而且在一定程度上决定了与食品安全事件相关的分类、聚类和关联知识挖掘的精准度。本...
关键词:词性标注 食品安全事件 深度学习模型 条件随机场模型 
基于多特征知识的先秦典籍词性自动标注研究被引量:22
《图书情报工作》2017年第12期64-70,共7页王东波 黄水清 何琳 
国家社会科学基金重大项目"基于<汉学引得丛刊>的典籍知识库构建及人文计算研究"(项目编号:15ZDB127);国家社会科学基金青年项目"哈佛燕京学社汉学引得丛刊研究"(项目编号:12CTQ019)研究成果之一;南京农业大学人文社会科学基金项目(项目编号:SKPT2016001)
[目的 /意义]先秦典籍在古代典籍中的地位极为重要。本文提出对先秦典籍进行词性自动标注的解决方法,以便更加准确地挖掘先秦典籍中的潜在知识。[方法 /过程]通过条件随机场模型,结合统计方法确定组合特征模板,并最终得到针对先秦典籍...
关键词:词性标注 先秦古籍 条件随机场模型 特征模板 古文信息处理 
藏文词性自动标注中歧义问题处理方法研究被引量:1
《计算机工程与应用》2013年第24期135-137,148,共4页羊毛卓玛 
国家自然科学基金(No.61063015);教育部"长江学者与创新团队发展计划"藏文信息技术创新团队项目(No.IRT0975)
藏文词性自动标注是藏文信息处理后续句法分析、语义分析及篇章分析必不可少的基础工作。词性歧义问题的处理是藏文词性自动标注的关键所在,也是藏文信息处理的难点问题。对藏文词性标注中词性歧义问题进行了分析研究,提出了符合藏文语...
关键词:藏文信息处理 词缀 词性 自动标注 词性排岐 
藏文词性自动标注方法的比较
《信息通信》2013年第2期270-271,共2页羊毛卓么 扎西加 
国家自然基金"藏语依存树库的构建"项目(项目号:61163043)
自然语言处理中机器对文本词性标注常用的方法有:基于规则方法、基于统计的方法和基于统计和规则相结合的方法三种。文章对三者用于藏文词性自动标注时在描述方式、标注效率和标注正确率等方面进行了对比研究分析,结果显示基于规则和统...
关键词:藏文 词性标注 方法 
面向韵律层边界自动划分的维吾尔语词性自动标注技术研究被引量:1
《计算机应用与软件》2011年第8期165-168,共4页努尔比娅.塔依尔 地里木拉提.吐尔逊 艾斯卡尔.肉孜 
新疆维吾尔自治区自然科学基金项目(200821125);新疆大学自然科学基金校院联合项目(XY080101;XY080127)
以语音合成系统文本分析模块中的韵律边界自动划分技术为背景,重点研究了维吾尔语词性自动标注技术:首先根据应用领域的特点确定词性的种类及其判定规则,筛选文本句子并对其进行手动词性标注,然后通过统计获得了词性概率表和词性对照表...
关键词:维吾尔语 韵律层 词性标注 语音合成 文本分析 
基于隐马尔科夫模型的维吾尔语词性自动标注系统的设计与实现
《和田师范专科学校学报》2009年第5期217-218,共2页艾则孜.吐尔逊 买合木提.买买提 
词性自动标注是对语料在高层次上进行分析的一个重要组成部分,其结果可以用于很多自然语言处理应用程序当中。而维吾尔语和其它语言一样也存在词兼类现象。本文介绍了维吾尔语词性自动标注系统的设计思想和实现过程。该系统基于隐马尔...
关键词:维吾尔语词性标注 马尔科夫模型 VITERBI算法 
基于HMM的藏语语料库词性自动标注研究被引量:6
《西北民族大学学报(自然科学版)》2009年第1期42-45,共4页苏俊峰 祁坤钰 本太 
<现代藏语语法信息词典>建设研究;甘肃省社科规划项目;项目编号2007-04
针对藏语区别于英语和汉语,分析藏语的构形特征,得到词性标注集.从人工标注的语料中统计词和词性频率以及训练得到二元语法的HMM模型参数,运用Viterbi算法完成基于统计方法的词性标注.
关键词:藏语词性标注 词性标注集 HMM 
哈萨克语词性自动标注研究初探被引量:8
《计算机工程与应用》2008年第20期242-244,共3页刘艳 古丽拉.阿东别克 伊力亚尔 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60763005)
词性标注在很多信息处理环节中都扮演着关键角色。哈萨克语作为新疆地区通用的少数民族语言之一,自然语言处理中的一些基础性的课题同样成为迫切需要解决的问题。分析了哈萨克语的构形语素特征,基于词典的一级标注基础上,采用统计方法,...
关键词:哈萨克语词性标注 构形语素 二元语法 HMM 
现代维吾尔语同形词词性自动标注探析被引量:1
《语言与翻译》2006年第3期35-38,共4页赛麦提.麦麦提明 
本文在介绍词性自动标注系统原理的基础上,初步探讨了对维吾尔文语料进行自动处理、统计分析过程中排除由词语的兼类和同形而引起的歧义的三种方法,即词语结构分析法、搭配词统计法和分布特点规则法等。
关键词:维吾尔语 同形词 词性 自动标注 
检索报告 对象比较 聚类工具 使用帮助 返回顶部