句子边界识别

作品数:12被引量:38H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:于新赵维纳李响才藏太艾山吾买尔更多>>
相关机构:新疆大学青海师范大学北京语言大学中国科学院软件研究所更多>>
相关期刊:《科技通报》《情报工程》《计算机工程》《计算机工程与应用》更多>>
相关基金:国家自然科学基金新疆维吾尔自治区高校科研计划中央高校基本科研业务费专项资金中国科学院知识创新工程更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于Transformer-CRF的文言文断句方法研究--以唐代墓志铭为例被引量:1
《情报工程》2021年第5期30-39,共10页韩旭 
中国科学技术信息研究所创新研究基金面上项目(MS2021-04);中国科学技术信息研究所重点工作(ZD2021-09)。
[目的/意义]本文探索了文言文的断句规则,并以唐代墓志铭为例进行基于语义的句子边界识别,降低了文言文因缺少标点造成的阅读障碍,减少了人工标注标点的工作量,为中国古文的资料分析整理提供技术支撑。[方法/过程]本文首先使用一种基于...
关键词:Transformer-CRF 繁体字向量 句子边界识别 古籍信息处理 
基于小句复合体的句子边界自动识别研究被引量:2
《中文信息学报》2021年第5期1-8,共8页何晓文 罗智勇 胡紫娟 王瑞琦 
北京语言大学研究生创新基金(中央高校基本科研业务费专项资金)(19YCX124);国家自然科学基金(62076037)。
自然语言文本的语法结构层次包括语素、词语、短语、小句、小句复合体、语篇等。其中,语素、词、短语等相关处理技术已经相对成熟,而句子的概念至今未有公认的、适用于语言信息处理的界定。该文重新审视了语言学中句子的定义和自然语言...
关键词:句子 小句复合体 句子边界识别 
以规则为主的英语句子边界识别方法的C#实现
《科技信息》2014年第14期23-24,29,共3页严灿勋 熊建国 
"解放军外国语学院2012年度学院科研基金"项目;2011年"基于语料库的军事英语综合研究"(批准号11BYY126)项目资助
利用从英汉词典中提取的带点缩略语和从语料库统计筛选出的句首常用词词表,通过C#编程,设计了英语句子边界识别工具RCESBD。采用互相检验的方法发现RCESBD正确率明显高于OpenNlP。
关键词:句子边界识别 C#编程 缩略语 语料库 
限定领域的汉语-维吾尔语句子级对齐研究被引量:1
《软件》2014年第3期62-64,共3页张亚军 贺琛琛 香丽芸 
国家自然科学基金(项目编号:60963018);新疆维吾尔自治区高校科研计划青年教师科研基金项目(项目编号:XJEDU2011S42);昌吉学院项目(项目编号:2012YJQT03;12JYYB004)~~
针对政府文献的汉语维吾尔语语料库特点,充分利用汉语和维吾尔语的句子特性,提出一种汉维句子级别的对齐方法。该方法重点分析政府领域的汉语和维吾尔语的句型,分别对汉语和维吾尔语的语料进行边界识别,避免了复杂句型对汉语-维吾尔语...
关键词:平行语料库 句子对齐 机器翻译 汉语-维吾尔语 句子边界识别 
现代藏语助动词结尾句子边界识别方法被引量:7
《中文信息学报》2013年第1期115-119,共5页赵维纳 于新 刘汇丹 李琳 王磊 吴健 
国家重大科技专项资助项目(2010ZX01036-001-002;2010ZX01037-001-002);国家自然科学基金资助项目(61202219;61202220);中国科学院知识创新工程资助项目(KGCX2-YW-512)
藏语句子边界的正确识别是藏文文本处理首先要解决的问题。而藏语书面语中标点符号的特殊性是造成藏语句子边界识别困难的主要原因。该文主要对现代书面藏语中常见的以藏语助动词结尾的藏语句子边界识别进行研究,结合藏文标点符号的特...
关键词:藏语分句 藏语句子边界识别 藏语信息处理 中文信息处理 
基于转换的错误驱动与决策树算法的句子边界自动识别
《科技通报》2012年第10期134-136,共3页李康熙 李为山 
中央高校基本科研业务费专项资金资助(2012HGXJ0109);中央高校基本科研业务费专项资金资助(2012HGXJ0110)
结合基于转换的错误驱动算法和决策树算法,并综合考虑句点标记在语料库中的复杂使用情况,生成能够自动划分英语句子边界的程序。实验结果表明,该方法具有较高的准确率,能够为后续语料库加工提供良好的前提基础。
关键词:句子边界识别 基于转换的错误驱动算法 决策树算法 
最大熵和规则相结合的藏文句子边界识别方法被引量:17
《中文信息学报》2011年第4期39-44,共6页李响 才藏太 姜文斌 吕雅娟 刘群 
国家自然科学基金重大研究计划培育项目(90920004),国家自然科学基金重点资助项目(60736014)
句子边界识别是藏文信息处理领域中一项重要的基础性工作,该文提出了一种基于最大熵和规则相结合的方法识别藏语句子边界。首先,利用藏语边界词表识别歧义的句子边界,最后采用最大熵模型识别规则无法识别的歧义句子边界。该方法有效利...
关键词:最大熵 句子边界识别 藏文信息处理 
统计与规则相结合的维吾尔语句子边界识别被引量:7
《计算机工程与应用》2010年第14期162-165,共4页艾山.吾买尔 吐尔根.依步拉音 
国家自然科学基金No.60663006;新疆维吾尔自治区高新技术计划项目No.200712109~~
句子边界识别是词性标注和句法分析等自然语言处理系统的基础问题。提出了一种统计与规则相结合的维吾尔语句子边界识别方法,首先利用歧义段落分类算法分类段落,第二步对无歧义段落进行基于规则的句子边界识别,最后使用最大熵模型对有...
关键词:维吾尔文 句子边界识别 规则 特征选择 最大熵 
基于最大熵的维吾尔语句子边界识别模型被引量:7
《计算机工程》2010年第6期24-26,38,共4页艾山.吾买尔 吐尔根.依步拉音 
国家自然科学基金资助项目(60663006);新疆维吾尔自治区高技术计划基金资助项目(200712109);新疆维吾尔自治区高校科研计划基金资助重点项目(XJEDU2008I08)
采用最大熵模型实现维吾尔语句子边界识别,该模型的训练过程不需要提供手工收集规则、词性标注及形态分析,仅使用较容易获取的单词长度和音节等特征。为确定最佳特征模板,在特征空间上组合出不同特征模板进行测试。实验结果表明,最佳特...
关键词:维吾尔语 句子边界识别 特征选择 最大熵 
汉语-维吾尔语句子级对齐系统分析及其实现被引量:3
《中国科技纵横》2010年第6期126-126,152,共2页张亚军 吐尔根·依布拉音 田生伟 
本文主要描述了在自然语言处理中汉语一维吾尔语的句子级对齐系统的设计与实现。系统主要实现对维语和汉语的句子边界进行识别、对于双语进行段落级的对齐,以及把基于规则和基于句子长度的算法相结合实现维语和汉语句子级的识别。本系...
关键词:自然语言处理 双语语料库 句子边界识别 句子对齐 
检索报告 对象比较 聚类工具 使用帮助 返回顶部