汤帜

作品数:36被引量:244H指数:6
导出分析报告
供职机构:北京大学更多>>
发文主题:授权数字版权保护技术文档图像知识点更多>>
发文领域:自动化与计算机技术文化科学政治法律轻工技术与工程更多>>
发文期刊:《北京信息科技大学学报(自然科学版)》《计算机与网络》《情报学报》《中文信息学报》更多>>
所获基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划国家高技术研究发展计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于数据增强和多任务特征学习的中文语法错误检测方法被引量:2
《中文信息学报》2022年第12期36-43,共8页谢海华 陈志优 程静 吕肖庆 汤帜 
国家重点研发计划(2019YFB1406302);国家自然科学基金(61573028,61432020);北京市自然科学基金(4142023);北京新星计划项目(XX2015B010)。
由于中文语法的复杂性,中文语法错误检测(CGED)的难度较大,而训练语料和相关研究的缺乏,使得CGED的效果还远未达到实用的程度。该文提出一种CGED模型,APM-CGED,采用数据增强、预训练语言模型和基于语言学特征多任务学习的方式,弥补训练...
关键词:中文语法错误检测 数据增强 多任务学习 
表格识别技术研究进展被引量:21
《中国图象图形学报》2022年第6期1898-1917,共20页高良才 李一博 都林 张新鹏 朱子仪 卢宁 金连文 黄永帅 汤帜 
国家重点研发计划资助(2019YFB1406303)。
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识...
关键词:表格区域检测 表格结构识别 表格内容识别 深度学习 单元格识别 表格信息抽取 
结合统计特征和图模型的半监督式中文关键短语抽取方法被引量:2
《中文信息学报》2022年第4期57-65,共9页谢海华 陈雪飞 都仪敏 吕肖庆 汤帜 
国家重点研发计划(2019YFB1406302);国家自然科学基金(61472014,61573028,61432020);北京市自然科学基金(4142023,L192024);北京新星计划项目(XX2015B010)。
关键短语抽取,即从文档中抽取能够表达文档主题和内容的关键短语集合,对于信息检索和文档分类等文本处理任务具有重要意义。然而,现有文献缺乏针对中文特点的关键短语抽取算法的研究。为此,该文提出了一种半监督式中文关键短语抽取模型...
关键词:中文关键短语抽取 半监督式方法 图模型 统计特征 
CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法被引量:4
《中文信息学报》2021年第5期38-45,共8页谢海华 李奥林 李亚博 陈志优 程静 吕肖庆 汤帜 
国家重点研发计划(2019YFB1406302);国家自然科学基金(61472014,61573028,61432020);北京市自然科学基金(4142023);北京市科技新星计划(XX2015B010)。
由于汉语语义表达的多样性和复杂性,中文错别字自动纠正目前存在很多挑战。现有的错别字纠正算法的性能普遍不够理想,而且需要大量高质量的语料进行训练。该文提出一种基于预训练语言模型的错别字纠正方法CPLM-CSC,能够显著地提高纠错...
关键词:中文错别字纠正 预训练语言模型 单字级别模型 
面向多模式应用的权利描述语言
《计算机与网络》2020年第6期58-61,共4页俞银燕 崔晓瑜 汤帜 张倩影 
国家重点研发计划项目(2017YFB1401000)。
随着媒体融合的推进,数字内容服务多样化和终端智能化趋势加快,数字内容的价值日益显著,无歧义的权利描述是对数字内容进行有效授权和使用控制的基础。分析了数字内容权利描述现有技术的不足,提出了一种面向多模式应用的权利描述语言—...
关键词:数字版权保护 权利描述语言 多模式应用 
面向多媒体版权保护的设备授权标识的生成方法
《广播电视信息》2018年第A01期23-27,共5页俞银燕 汤帜 张行功 崔晓瑜 
"互联网+环境中基于国产密码的多媒体版权保护与监管技术"项目资助;项目编号2018YFB0803700(课题二:2018YFB0803702)
通过设备授权标识,将数字内容与授权设备绑定,是有效的防盗版手段。本文分析了设备授权标识问题,提出一种面向多媒体版权保护的设备授权标识的生成方法,通过制定设备授权标识策略、设备授权标识结构和标识生成算法,解决数字内容与授权...
关键词:版权保护 设备授权标识 标识结构 标识生成算法 
一种基于图塌缩的药物分子检索方法
《北京大学学报(医学版)》2018年第2期368-374,共7页瞿经纬 吕肖庆 刘振明 廖媛 孙鹏晖 王蓓 汤帜 
国家自然科学基金(61573028;61673029);新闻出版业科技与标准重点实验室(新闻出版智能媒体技术重点实验室);北京大学医学-信息科学交叉学科种子基金项目(BMU20160579)资助~~
目的:为实现准确、高效的医药信息查询,本文探索了一种基于图结构的药物分子检索方法。方法:基于图结构的药物分子检索方法以接收智能终端的拍照或手绘作为输入,并将输入的结构式形式化为相应图结构,基于对图匹配效率的直接影响因素的分...
关键词:信息存储和检索 分子结构 图结构 超图 算法 
基于安全目录的文件保护机制被引量:1
《北京大学学报(自然科学版)》2018年第1期14-24,共11页沈熳婷 俞银燕 汤帜 崔晓瑜 
863计划(2012AA013102)资助
针对现有的文件保护方法侧重于保护单个设备上文件信息的特点,面向跨设备使用和保护文件信息的需求,提出一种高效的基于安全目录的文件保护机制。该机制可动态地检测安全目录中的用户行为,实时保护文件信息,支持文件多设备安全共享。实...
关键词:安全目录 文件保护机制 多设备 加密 访问控制 
中英文科技主题排序相关性的比较研究:以计算机领域为例被引量:2
《情报学报》2017年第9期940-953,共14页蒋卓人 高良才 赵星 刘晓钟 袁珂 汤帜 
中国博士后科学基金面上项目"面向需求变迁的异构学术信息推荐技术研究"(2016M590019);国家自然科学基金项目"版式文档中复杂异构对象的识别技术研究"(61573028)
主题排序是信息检索、信息组织等情报学核心领域的重要问题,本研究从静态全局角度和动态时间维度上对这一问题进行综合性探索,尝试以出现频率、被引次数、Page Rank值等文献计量学参量为基础,重点对中英文科技主题在各自数据集中的排序...
关键词:主题排序 比较研究 可视化 
“顶天立地”的民族自主意识 锲而不舍的科学创新精神
《中国印刷》2017年第2期21-24,共4页汤帜 
中国是印刷术的故乡,但是,进入20世纪以来,由于电子计算机和光学技术的迅速发展,西方率先结束了活字印刷,采用了“电子照排技术”。而中国印刷业仍停留在“以火熔铅,以铅铸字,以铅字排版,以版印刷”的铅印阶段。印刷工人要托着沉甸甸的...
关键词:中国印刷业 印刷工人 激光照排系统 科学创新精神 电子分色 出版印刷 郭宗明 王选 方正集团 市场占有率 
检索报告 对象比较 聚类工具 使用帮助 返回顶部