教育部人文社会科学研究基金(12YJC870008)

作品数:16被引量:66H指数:4
导出分析报告
相关作者:顾磊赵阳王勇更多>>
相关机构:南京邮电大学南京林业大学更多>>
相关期刊:《科技信息》《兰台世界(中旬)》《计算机应用研究》《计算机技术与发展》更多>>
相关主题:古籍数字化中文分词古籍教学林业更多>>
相关领域:自动化与计算机技术文化科学文学历史地理更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于字串切分统计词典的繁体中文拼写检错方法
《计算机应用研究》2016年第5期1370-1373,1378,共5页王勇 顾磊 
国家自然科学基金资助项目(61302157);国家教育部人文社会科学研究青年基金资助项目(12YJC870008);江苏省教育厅高校哲学社会科学基金资助项目(2013SJB870004);江苏省社科研究文化精品课题(12SWC-030)
针对繁体中文拼写检错的问题进行了研究,提出一种基于字串切分统计词典的检错方法。利用语料库中字串出现的频率信息作为检错依据,根据字串及其频率信息来建立统计词典,并设计了基于统计规则评判的检错算法。以SIGHAN7会议中文拼写校验...
关键词:中文语言处理 繁体中文拼写检错 中文分词 字串切分 统计词典 混淆集 
古籍智能整理研究现状及存在的问题被引量:4
《图书馆学研究》2016年第9期54-58,共5页顾磊 赵阳 
教育部人文社会科学研究青年基金项目"基于中文信息处理技术的古籍整理研究"(项目编号:12YJC870008);江苏省社科研究文化精品课题"基于文字图像分析技术的珍贵古籍数字化方法的研究"(项目编号:12SWC-030)的研究成果之一
随着古籍数字化技术的深入发展,古籍智能整理渐渐成为众多研究者的研究目标,近年来已经取得了一些成绩。文章提出一个新的分层的古籍智能整理系统,该系统是一个具有基础层和应用层的两层系统,然后在搜集整理当前研究成果的基础上,分别从...
关键词:古籍智能整理 古籍数字化 分层系统 中文信息处理技术 
古籍数字化标注资源建设的意义及其现状分析被引量:4
《图书馆学研究》2016年第4期49-52,36,共5页顾磊 赵阳 
教育部人文社会科学研究青年基金项目"基于中文信息处理技术的古籍整理研究"(项目编号:12YJC870008);江苏省社科研究文化精品课题"基于文字图像分析技术的珍贵古籍数字化方法的研究"(项目编号:12SWC-030)的研究成果
首先从古籍的智能整理、智能检索和智能翻译等三个方面论述古籍数字化标注资源建设的重要意义。其次在搜集整理当前研究成果的基础上,从古籍的分词与词性标注、古籍的句法标注等两个方面对古籍数字化标注资源的建设现状进行概述。最后...
关键词:古籍数字化 标注资源 中文分词 
基于委员会投票的主动学习中文分词方法
《图书馆学研究》2016年第1期36-40,70,共6页顾磊 梁喜涛 
教育部人文社会科学研究青年基金项目"基于中文信息处理技术的古籍整理研究"(项目编号:12YJC870008);江苏省社科研究文化精品课题"基于文字图像分析技术的珍贵古籍数字化方法的研究"(项目编号:12SWC-030)的阶段性研究成果
主动学习方法可以减少人工标注海量数据时的代价,因此在中文信息处理领域中具有非常重要的作用。文章提出了一种基于委员会投票的主动学习分词方法。该方法的核心思想就是利用Bagging算法构建委员会并对其进行投票,然后采用新的样本选...
关键词:委员会投票 中文分词 主动学习 
基于最近邻的主动学习分词方法被引量:1
《计算机科学》2015年第6期228-232,261,共6页梁喜涛 顾磊 
国家自然科学基金(61302157);教育部人文社会科学研究青年基金(12YJC870008);江苏省教育厅高校哲学社会科学基金(2013SJB870004);江苏省社科研究文化精品课题(12SWC-030)资助
分词是中文自然语言处理中的一项关键基础技术。为了解决训练样本不足以及获取大量标注样本费时费力的问题,提出了一种基于最近邻规则的主动学习分词方法。使用新提出的选择策略从大量无标注样本中选择最有价值的样本进行标注,再把标注...
关键词:中文分词 主动学习 不确定性取样 最近邻规则 
基于分层选择策略的主动学习分词方法
《计算机应用研究》2015年第5期1353-1356,共4页梁喜涛 顾磊 
国家自然科学基金资助项目(61302157);国家教育部人文社会科学研究青年基金资助项目(12YJC870008);江苏省教育厅高校哲学社会科学基金资助项目(2013SJB870004);江苏省社科研究文化精品课题(12SWC-030)
为了克服训练样本不足、获取大量标注样本费时费力的问题,在基于不确定选择策略的基础上,提出了一种新的基于分层选择策略的主动学习方法。使用新提出的选择策略从大量无标注的样本中选择最有价值的样例,进行标注后加入到训练集中来训...
关键词:中文分词 主动学习 不确定性取样 分层取样策略 
中文分词与词性标注研究被引量:48
《计算机技术与发展》2015年第2期175-180,共6页梁喜涛 顾磊 
国家自然科学基金资助项目(61302157);教育部人文社会科学研究青年基金(12YJC870008);江苏省教育高校哲学社会科学基金(2013SJB870004);江苏省社科研究文化精品课题(12SWC-030)
分词和词性标注是中文语言处理的重要技术,广泛应用于语义理解、机器翻译、信息检索等领域。在搜集整理当前分词和词性标注研究与应用成果的基础上,对中文分词和词性标注的基本方法进行了分类和探讨。首先在分词方面,对基于词典的和基...
关键词:中文分词 主动学习 词性标注 自然语言处理 一体化模型 
林业古籍数字化建设及对林业研究的影响
《兰台世界(中旬)》2015年第1期39-40,共2页赵阳 顾磊 
江苏省教育厅2013年度高校哲学社会科学基金资助项目(2013SJB870004);教育部人文社会科学研究项目(12YJC870008);江苏省社科研究文化精品课题(12SWC-030)
论文在考察目前林业古籍整理现状的基础上,提出林业古籍数字化建设的基本内容,并探讨数字化建设成果将对林业研究产生的影响。
关键词:林业古籍 数字化 林业研究 
林业古籍断句模式语料库建设方案探讨——以《树艺篇》为训练文本被引量:2
《科技视界》2015年第3期23-23,47,共2页赵阳 
江苏省教育厅2013年度高校哲学社会科学基金资助项目(2013SJB870004);教育部人文社会科学研究青年基金项目(12YJC870008)
随着中文信息处理技术的不断提高,古籍自动化标点的研究也日益趋向成熟。但是现有的模式并不太适合林业类古籍。林业古籍有其独特的表达和术语,与一般性质的古籍存在区别的。本文以《树艺篇》为训练文本,对林业古籍断句语料库的建设问...
关键词:林业古籍 断句 语料库 《树艺篇》 
山海经中的古人地理空间认知研究被引量:1
《绿色科技》2014年第1期201-203,共3页赵阳 
江苏省教育厅2013年度高校哲学社会科学基金资助项目(编号:2013SJB870004)资助;教育部人文社会科学研究项目(编号:12YJC870008)资助
在现有《山海经》研究的基础上,结合地理空间认知理论体系,针对《山海经》一类的古籍研究中较少涉及的角度进行了探讨。从空间认知的角度进一步确定了《山海经》的性质为地理书的及《山海经》中古人空间认知的特点。对从这一角度出发进...
关键词:山海经 地理空间认知 模式 特征 
检索报告 对象比较 聚类工具 使用帮助 返回顶部