胡韧奋

作品数:19被引量:120H指数:7
导出分析报告
供职机构:北京师范大学文学院更多>>
发文主题:机器翻译自动识别自然语言处理古汉语断句更多>>
发文领域:自动化与计算机技术语言文字文化科学文学更多>>
发文期刊:《曲靖师范学院学报》《中国诗歌研究》《开放学习研究》《情报工程》更多>>
所获基金:国家高技术研究发展计划国家自然科学基金国家社会科学基金教育部人文社会科学研究基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于专名识别技术的古典文献“远读”初探——以雍正《畿辅通志》为例
《南京师范大学文学院学报》2023年第1期53-61,共9页诸雨辰 李绅 胡韧奋 
国家自然科学基金青年项目“面向古籍整理智能化的知识表示与加工研究”(62006021);北京市社科重点项目“古典文献的智能化分析与关联技术研究”(21DTR037)。
应用BERT模型,设计了一种基于多任务联合学习的古籍文本信息标注工具,可实现对标点、专名信息的自动标注。相较于以往同类技术而言,该工具对人名、地名、时间名、书名的有效识别度更高,并将有助于“远读”方法在古籍文献领域的实现。以...
关键词:命名实体识别 远读 《畿辅通志》 
古汉语词义标注语料库的构建及应用研究被引量:5
《中文信息学报》2022年第5期21-30,共10页舒蕾 郭懿鸾 王慧萍 张学涛 胡韧奋 
国家自然科学基金(62006021);北京市社会科学基金青年学术带头人项目(21DTR037)。
古汉语以单音节词为主,其一词多义现象十分突出,这为现代人理解古文含义带来了一定的挑战。为了更好地实现古汉语词义的分析和判别,该研究基于传统辞书和语料库反映的语言事实,设计了针对古汉语多义词的词义划分原则,并对常用古汉语单...
关键词:古代汉语 语料库 词义标注 词义消歧 
自然语言处理在其他学科领域的影响考察——基于CNKI的中文文献挖掘被引量:6
《情报杂志》2021年第12期169-176,共8页蒋彦廷 胡韧奋 
国家自然科学基金青年项目“面向古籍整理智能化的知识表示与加工研究”(编号:62006021);教育部人文社科基金项目“国际汉语教材文本可读性智能评价方法”(编号:18YJAZH112);国家语委十三五科研规划重点项目(全球中文联盟专项)“面向国际中文教育的文本可读性智能评价方法研究及分析系统构建”(编号:ZDI135-141)的研究成果之一。
[研究目的]探索自然语言处理(Natural Language Processing,NLP)在其他学科领域的影响力,以促进技术的落地应用与创新研究。构建NLP主题分类体系与数据集,能为未来相关论文主题识别、NLP跨学科知识扩散提供有力支撑。[研究方法]利用《...
关键词:自然语言处理 学科交叉 中国图书馆分类法 NLP主题分类体系 NLP论文主题分类数据集“NLP-others” 多标签分类 
古籍数字化关键技术评述被引量:16
《数字人文研究》2021年第3期83-88,共6页苏祺 胡韧奋 诸雨辰 严承希 王军 
中宣部出版局古籍处项目“古籍数字化关键技术创新与应用研究”(2020)课题成果之一
中国历史文化典籍是中华民族的宝贵财富.在数字环境下,实现古籍的数字化整理与利用,能够为数字人文研究、历史学研究及其他人文研究提供基础性资源,也是推动中华文明创造性转化与创新性发展的重要依托.古籍的数字化整理包括纸本资源的...
关键词:古籍整理 古籍数字化 自然语言处理 数字人文 
基于分布式表示的汉字部件表义能力测量与应用被引量:4
《中文信息学报》2021年第5期17-26,共10页梁诗尘 唐雪梅 胡韧奋 吴金闪 刘智颖 
国家语委科研项目(ZDI135-42);国家社会科学基金(18CYY029);教育部人文社会科学基金(18YJAZH112)。
汉字的表义性是其区别于表音文字的一大特点。部件作为构字单位,同汉字的意义之间有着很大的联系。然而,汉字部件的表义能力究竟如何是学界尚待讨论的课题。针对这一问题,该文从汉字部件入手,提出了融合部件的字词分布式表示模型。该模...
关键词:汉字部件 表义能力测量 分布式表示 
基于深层语言模型的古汉语知识表示及自动断句研究被引量:18
《中文信息学报》2021年第4期8-15,共8页胡韧奋 李绅 诸雨辰 
国家自然科学基金(62006021);教育部人文社会科学研究青年基金(18YJC751073);国家社会科学基金(18ZDA238)。
古文句读不仅需要考虑当前文本的语义和语境信息,还需要综合历史文化常识,对专家知识有较高要求。该文提出了一种基于深层语言模型(BERT)的古汉语知识表示方法,并在此基础上通过条件随机场和卷积神经网络实现了高精度的自动断句模型。...
关键词:古汉语 自动断句 深层语言模型 
基于BERT模型的图书表示学习与多标签分类研究被引量:9
《新世纪图书馆》2020年第9期38-44,共7页蒋彦廷 胡韧奋 
国家社科基金青年项目“面向汉语国际教育的智能测试技术研究”(项目编号:18CYY029)研究成果之一。
中文图书细粒度多标签分类的自动化,有利于促进图书的检索与学科的沟通。文章充分发挥BERT语言模型的微调特性,提出一种通过21类粗粒度分类微调语言模型,学习到更好的图书表示,进而实现细粒度分类的新策略。结果显示,在单标签的分类任务...
关键词:中文图书 BERT模型 深度学习 微调策略 多标签分类 
基于文本挖掘的继续教育机构评价方法新探被引量:8
《开放学习研究》2019年第6期8-14,共7页郭玉娟 胡韧奋 
教育部“全国高校继续教育发展年度报告”项目(项目编号:311800001)的系列研究成果之一
继续教育是构建终身教育体系的重要力量,对继续教育机构办学水平的评价是促进其发展的重要手段,但当前的评价方法在全面性、可行性方面存在局限,文本挖掘技术为评价提供了新的视角。本研究首先提出了评价继续教育机构办学水平的理论模型...
关键词:继续教育 评价模型 发展年度报告 逻辑规则 文本相似度 
清人“拗救”说再审视——以《全唐诗》15290首律诗为样本被引量:2
《中国诗歌研究》2019年第1期228-239,共12页诸雨辰 胡韧奋 
中央高校基本科研业务费专项资金资助.
基于计算机自动标注技术,分析《全唐诗》15290首律诗中的拗句,共探测出13683句单拗、2011联成对拗句。以此为参照,深入辨析王士禛、赵执信等人的"拗救"说。可将单句"平平平仄仄"的"四拗三救"和对句"仄仄平平仄,平平仄仄平"的"三拗三救"...
关键词:拗救 《全唐诗》 格律 平仄 
面向专利领域的汉英机器翻译融合系统被引量:7
《情报工程》2017年第3期105-115,共11页李洪政 赵凯 胡韧奋 蒋宏飞 朱筠 晋耀红 
国家高技术研究发展计划基金项目"海量文本多层次知识表示及中文文本理解应用系统研制"(2012AA011104)的资助
面向专利领域的机器翻译近年来已成为机器翻译的重要应用领域之一。本文提出了一个汉英专利文本机器翻译融合系统,该系统以规则系统为主导搭建,并把规则翻译方法和基于短语的统计翻译系统相结合。在融合系统中,规则系统主要负责源语言...
关键词:专利 规则方法 统计方法 融合系统 机器翻译 
检索报告 对象比较 聚类工具 使用帮助 返回顶部