词语切分

作品数:29被引量:218H指数:5
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:姜文斌刘群吴金星长青段慧明更多>>
相关机构:中国科学院北京大学内蒙古大学南京师范大学更多>>
相关期刊:《华章(初中读写)》《外语研究》《东南大学学报(哲学社会科学版)》《语言文字应用》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
上古汉语分词与词性标注加工规范——基于《史记》深加工语料库的标注实践被引量:2
《语言文字应用》2023年第4期93-104,共12页郑童哲恒 李斌 
国家语委项目“面向古文读写能力的古汉语分级字表研究”(YB145-41);江苏省研究生科研与实践创新计划项目“《史记》精加工语料库的建设规范及计量研究”(KYCX23_1605);国家社科重大项目“中国古代典籍跨语言知识库构建及应用研究”(21&ZD331)的资助。
上古(先秦两汉)时期流传至今的古籍经典数量大、价值高,亟需进行计算处理和挖掘,作为词法分析的分词与词性标注就成为古汉语信息处理的基础性工作。古汉语文本具有缺乏词语边界、内容艰深、与现代汉语差异大、不同时期差异大等特点,古...
关键词:上古汉语 词语切分 词性标注 规范 《史记》 
韵律模式和语素位置概率对汉语学习者切分歧义词的影响
《华文教学与研究》2023年第1期43-51,共9页鹿士义 黄韵 
在中文文本阅读过程中,读者如何对词语进行分词和识别,基本加工单位是什么,一直存在着争论。本文采用线上词汇命名任务,以汉语母语者和高级水平的二语者为被试,研究韵律模式和语素位置概率对汉语词语切分和识别的影响,并在此基础上探讨...
关键词:词语切分 韵律模式 语素位置概率 基本加工单位 
语音意识和词素意识在初级水平留学生汉语阅读中的作用被引量:8
《语言教学与研究》2020年第3期10-21,共12页郝美玲 汪凤娇 
北京语言大学院级项目(中央高校基本科研业务费专项资金,项目批准号:19YJ010203);北京语言大学梧桐创新平台项目(中央高校基本科研业务费专项资金,项目编号:19PT01);国家社会科学基金重大项目(项目编号:17ZDA305)的支持。
语音意识和词素意识在汉语阅读中的重要性引发了关于汉语儿童相关问题的大量研究,但是在汉语作为第二语言的阅读发展中,相关研究却非常罕见。本研究以初级汉语水平学习者为研究对象,首次考察了语音意识和同形词素意识在留学生汉字阅读...
关键词:语音意识 词素意识 字词阅读准确性 词语切分流畅性 
试论中古汉语语料库佛教文献分词规范被引量:2
《东南大学学报(哲学社会科学版)》2019年第1期135-142,145,共9页化振红 
国家社科基金重大招标项目"汉语史语料库建设研究"(10&ZD117);江苏高校优势学科建设工程资助项目(PAPD)阶段性成果
在国家标准《信息处理用现代汉语分词规范》基础上,兼顾中古词汇的过渡性、佛教文献的特殊性、人工分词的操作性、分词软件识别的便利性等多方面因素,讨论了中古汉语语料库佛教文献的词语切分问题,建立了针对中古佛教文献的分词规范:以...
关键词:中古汉语 佛教文献 语料库 动态义项库 词语切分 
口语加工中的词语切分线索被引量:2
《心理科学进展》2018年第10期1765-1774,共10页于文勃 梁丹丹 
江苏高校优势学科建设工程资助项目(PAPD)资助
词是语言的基本结构单位,对词语进行切分是语言加工的重要步骤。口语语流中的切分线索来自于语音、语义和语法三个方面。语音线索包括概率信息、音位配列规则和韵律信息,韵律信息中还包括词重音、时长和音高等内容,这些线索的使用在接...
关键词:口语 词语切分 语音 语义 语法 
基于Systran的翻译本地化难点概述
《考试周刊》2014年第6期167-168,共2页焦育玲 
安康学院AYQDRW201216项目成果
由于汉语与英语有不同的特点,导致机器翻译时把汉语当做源语言要比把英语当做源语言要困难得多。本文试图从汉英机器翻译的角度探讨汉语自动分析的难点.包括词法分析、句法分析和汉英转换中的难点。
关键词:计算机翻译 Systran 词语切分 未登录词 
自动识别藏文整句的方法研究被引量:2
《信息与电脑(理论版)》2013年第8期9-10,共2页当增卓玛 安见才让 
鉴于藏文中标识句子结束的结尾词和非结尾词的复杂性及标点符号的特殊性,只靠标点符号是不能确定是否是一句完整的藏文句子,藏语句子中除语义外,如何正确的找到结尾词,是准确识别藏文整句的首要问题,也是近一步提高藏文整句的识别率。...
关键词:整句 自动识别 再后加字 结尾语 藏语文 自然语言处理 词语切分 楔形 语法系统 格助词 
维吾尔语词法分析的有向图模型被引量:22
《软件学报》2012年第12期3115-3129,共15页麦热哈巴·艾力 姜文斌 王志洋 吐尔根·依布拉音 刘群 
国家自然科学基金(61063026);国家社会科学基金(10AYY006);国家工信部电子发展基金(工信部财(2009)553);新疆高校青年教师科研培养基金(XJEDU2010S07);新疆大学优秀博士创新项目基金
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词...
关键词:维吾尔语 词法分析 词语切分 词性标注 有向图 
基于上下文的拉丁维文拼写校对的研究
《计算机系统应用》2011年第12期60-63,共4页何晋一 陈红英 姜文斌 张海波 刘群 
国家自然科学基金(60736014)
根据拉丁维文的特点,分析了拉丁维文常见的拼写错误类型,提出了一种将最小编辑距离、基于有向图模型的词语切分和trigram语言模型融合的方法,实现了基于上下文的拉丁维文的自动拼写校对系统,从而大大提高了拉丁维文的校对准确率。在新...
关键词:拉丁维文 最小编辑距离 有向图模型 词语切分 语言模型 上下文 拼写校对 
蒙古语词法分析的有向图模型被引量:3
《中文信息学报》2011年第5期94-100,共7页姜文斌 吴金星 长青 那顺乌日图 刘群 赵理莉 
国家自然科学基金资助项目(Contract60736014);863重点项目(2006AA010108);教育部;国家语委民族语言文字规范标准建设及信息化资助项目(MZ115-038)
我们为蒙古语词法分析建立了一种生成式的概率统计模型。该模型将蒙古语语句的词法分析结果描述为有向图结构,图中节点表示分析结果中的词干、词缀及其相应标注,而边则表示节点之间的转移或生成关系。特别地,在本工作中我们刻画了词干...
关键词:蒙古语 词法分析 词语切分 词性标注 词干提取 有向图 
检索报告 对象比较 聚类工具 使用帮助 返回顶部