董宇

作品数:6被引量:12H指数:2
导出分析报告
供职机构:金陵科技学院更多>>
发文主题:叙事作品词义消歧标注语料库电动语料库更多>>
发文领域:语言文字自动化与计算机技术兵器科学与技术政治法律更多>>
发文期刊:《广西师范大学学报(自然科学版)》《语言文字应用》《南京师范大学学报(工程技术版)》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划国家社会科学基金江苏省社会科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-6
视图:
排序:
基于CRF模型的组合型歧义消解研究被引量:8
《南京师范大学学报(工程技术版)》2008年第4期73-76,94,共5页丁德鑫 曲维光 徐涛 董宇 
国家自然科学基金(60773173);国家"973"计划基金(2004CB318102);江苏省社科基金(06JSBYY001;07YYB003);国家社科基金(07BYY050)资助项目
组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型,以歧义字段的上下文的词和词性建立特征模板,进行歧义消解研究.以1998年半年《人民日报》为语料,对常用的10个组合歧义字段进行消歧,平均消歧正确率达到96.35%,...
关键词:中文自动分词 组合歧义 CRF 
带标注语料库的分词不一致研究综述
《现代语文(下旬.语言研究)》2008年第8期106-108,共3页董宇 
目前,带标注语料库因为标注质量等原因严重影响了汉语的自动分词和测评,而其中影响较大的就是语料库中分词的不一致。本文总结并分析了前人对于分词不一致的各种研究,廓清了分词不一致的概念,提出分词不一致最好按照所属类别统一处...
关键词:分词不一致 语料库 综述 
基于词库与词法的分词不一致研究
《浙江教育学院学报》2008年第3期96-102,共7页董宇 陈小荷 
分词不一致问题一直严重影响带标注语料库的标注质量,利用词库与词法知识,可以合理地阐释分词不一致产生的根源,并结合建立的规则库、组合型歧义库、固定词表和特殊单字词表,可以解决汉语分词语料库中相同结构类型的分词不一致问题。计...
关键词:分词不一致 词库 词法 自动分词 
面向大型叙事作品的指人成分识别被引量:1
《语言文字应用》2008年第1期113-119,共7页钱小飞 陈小荷 董宇 何晓丽 
本文定义了指人成分的概念,分析了指人成分的构成和分布特征,并面向大型叙事作品,提出了一种基于邻字熵统计和规则发现相结合的指人成分识别方法。实验对小说《英雄出世》的生文本进行了多次抽样测试,取得了86.93%的正确率和91.83%的召...
关键词:指人成分 识别 邻字熵 规则 
基于语境计算模型的汉语词义消歧(英文)
《广西师范大学学报(自然科学版)》2006年第4期179-182,共4页曲维光 陈小荷 董宇 穗志方 
Supported by 973 Natural Basic Research Program of China(2004CB318102);National Nature Sci-ence Foundation of China(60503071);Jiangsu Province Fund of Social Science Project(06JSBYY001)
提出利用相对词频(Relative Word Frequency,RWF)来评估词语之间搭配强度。基于相对词频,提出语境计算模型,用于对汉语文本词义进行消歧。选择3个常用多义词进行试验,结果验证了该方法的有效性。
关键词:语境计算模型 词义消歧 相对词频 
对新疆学生汉语作文中偏误的统计分析及对比思考被引量:3
《现代语文(下旬.语言研究)》2006年第4期102-104,共3页董宇 
关键词:少数民族学生 统计分析 偏误 汉语作文 第二语言习得者 新疆 第二语言学习 语言环境 
检索报告 对象比较 聚类工具 使用帮助 返回顶部