徐润华

作品数:14被引量:69H指数:4
导出分析报告
供职机构:金陵科技学院更多>>
发文主题:四字格《左传》自动对齐先秦文献注疏更多>>
发文领域:自动化与计算机技术语言文字文化科学文学更多>>
发文期刊:《常熟理工学院学报》《湖州师范学院学报》《中文信息学报》《南京师范大学文学院学报》更多>>
所获基金:国家社会科学基金国家自然科学基金国家教育部“211”工程江苏省教育厅哲学社会科学基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
面向古籍数字人文的《资治通鉴》自动摘要研究——以SikuBERT预训练模型为例被引量:13
《图书馆论坛》2022年第12期129-137,共9页徐润华 王东波 刘欢 梁媛 陈康 
国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”(项目编号:21&ZD331);江苏高校哲学社会科学研究项目“基于CSSCI的组块级汉英平行语料库构建及知识挖掘研究”(项目编号:2018SJA0473)研究成果。
能降低信息获取成本,对篇幅长而句子短、文字理解门槛高的古籍文献而言尤其必要,但针对古文的自动摘要研究很少。文章面向《资治通鉴》语料,基于SikuBERT预训练模型进行自动摘要实验,并对比其与传统抽取式自动摘要算法和百度智能云摘要...
关键词:数字人文 SikuBERT 预训练模型 自动摘要 
一种面向Web的英汉平行语料库的构建方法被引量:2
《金陵科技学院学报(社会科学版)》2021年第4期51-56,共6页徐润华 王东波 
江苏高校哲学社会科学研究基金项目“基于CSSCI的组块级汉英平行语料库构建及知识挖掘研究”(2018SJA0473);金陵科技学院高层次人才科研启动基金项目“大数据环境下面对论文相似性检测的学术资源预处理研究”(jitb202137)。
随着自然语言处理领域各项研究的发展,平行语料库作为支撑自然语言处理技术的基础资源,发挥着越来越重要的作用。利用Web中的海量信息资源,采取信息抽取的方法,自动获取英汉双语平行语料资源。在获取过程中,首先确定抓取网站和制定词表...
关键词:平行语料库 GUN Wget软件 条件随机场 英汉双语 Web 
数字人文下的典籍深度学习实体自动识别模型构建及应用研究被引量:24
《图书情报工作》2021年第3期100-108,共9页杜悦 王东波 江川 徐润华 李斌 许超 徐晨飞 
国家自然科学基金面上项目"基于典籍引得的句法级汉英平行语料库构建及人文计算研究"(项目编号:71673143);国家社会科学基金重大项目"基于《汉学引得丛刊》的典籍知识库构建及人文计算研究"(项目编号:15ZDB127)研究成果之一。
[目的/意义]典籍是我国传统文化、思想和智慧的载体,结合数字人文的数据获取、标注和分析方法对典籍进行实体自动识别,对于后续应用研究具有重要意义。[方法/过程]基于经过自动分词与人工标注的25本先秦典籍构建古籍语料库,分别基于不...
关键词:数字人文 深度学习 命名实体识别 先秦典籍 
先秦注疏文献的内容分类
《湖州师范学院学报》2020年第9期63-69,共7页徐润华 梁社会 
国家社会科学基金项目“基于注疏文献的先秦汉语语料信息处理研究”(15BYY096);江苏高校哲学社会科学研究基金项目(2018SJA0473)。
几乎每种先秦文献都有非常丰富的注疏文献,这些注疏文献可以转化为结构化的形式加以利用,为先秦文献的信息处理服务。选取了25种先秦文献的注疏文献,提出了先秦注疏文献的格式范式,并在此基础上对注疏文献中的引文和注以及注和疏进行了...
关键词:注疏文献 结构化 范式 分类 
基于注疏的先秦文献信息处理探索
《常熟理工学院学报》2020年第4期92-99,共8页梁社会 徐润华 
国家社会科学基金项目“基于注疏文献的先秦汉语语料信息处理研究”(15BYY096)。
先秦文献是我国历史长河中的文化瑰宝,对其进行信息处理有着重要的社会意义。先秦文献信息处理是中文信息处理的一个分支,但先秦文献规模较小,现代汉语的信息处理模式并不能较好地适用于先秦文献。先秦文献的一个显著特点是,历代学者对...
关键词:先秦文献 注疏文献 信息处理 
《左传》及其注疏文献的内容自动对齐研究被引量:2
《金陵科技学院学报(社会科学版)》2019年第2期84-88,共5页徐润华 梁社会 
国家社会科学基金项目(15BYY096);江苏高校哲学社会科学研究基金项目(2018SJA0473)
自动对齐的目的是将半结构化的注疏文献转化为结构化形式,从而为先秦文献的信息处理提供可靠的帮助。探讨《左传》及其注疏文献的三种自动对齐方式:句子对齐、注释对齐和词汇对齐。在句子及注释对齐试验中,对齐的正确率为99.8%,召回率为...
关键词:注疏文献 句子对齐 注释对齐 词汇对齐 内容自动对齐 《左传》 
高校数字出版专业发展模式探析
《长江丛刊》2018年第32期202-202,共1页徐润华 
江苏高校哲学社会科学研究项目《基于CSSCI的组块级汉英平行语料库构建及知识挖掘研究》(项目批准号:2018SJA0473)的阶段成果
作为新兴专业,应主动适应社会的发展,坚持“融合”、“复合”、“联合”三个结合作为专业发展的主线,培养面向数字出版产业内容生产、了解数字出版产业发展规律、熟练掌握数字出版加工技术的复合型和应用型人才。
关键词:数字出版 应用型 复合型 
中国文学国家社会科学基金项目统计分析研究被引量:5
《西南民族大学学报(人文社会科学版)》2017年第7期221-231,共11页徐润华 王东波 
国家社会科学基金特别委托项目"国家社科基金项目成果学术影响力评估"(14@ZH051 2014-2016)阶段性成果
本文重点关注中国文学领域的国家社科项目,并以国家社会科学基金资助项目名单(1991-2014)和CNKI期刊全文数据库中获得的关于中国文学国家社科项目的相关数据为主要依据,对中国文学国家社科项目基本信息、中国文学国家社科项目标题、中...
关键词:文学 国家社科项目 统计分析 研究热点 
我国统计学研究热点知识图谱分析——基于CSSCI(2000-2011年)被引量:2
《西南民族大学学报(人文社会科学版)》2014年第8期230-236,共7页徐润华 黄爱玲 顾成伟 
本文以知识图谱作为研究工具,分年度构建了我国统计学关键词共现图谱,数据来源为2000-2011年间CSSCI收录统计学来源期刊发文信息。文章通过可视化分析相关年度的热点关键词,结合定量分析,展现十二年间我国统计学的科研脉络。
关键词:知识图谱 统计学 研究热点 
多语料库中汉语四字格的切分和识别研究被引量:4
《中文信息学报》2013年第5期15-21,42,共8页徐润华 曲维光 陈小荷 王东波 
国家社会科学基金资助项目(07BYY050);国家自然科学基金资助项目(61272221);南京农业大学人文社会科学项目(SK 2013023)
汉语四字格的能产性和派生性极强,利用四字格模式创造出的新词数量在现代汉语词汇中一直呈上升趋势。该文将研究的目光投向分词语料库中的四字格,对语料库中的四字格进行了系统的分类和归纳,并对语料库内部和语料库之间的四字格切分不...
关键词:四字格 分词语料库 切分不一致 CRF模型 
检索报告 对象比较 聚类工具 使用帮助 返回顶部