高良才

作品数:15被引量:52H指数:4
导出分析报告
供职机构:北京大学更多>>
发文主题:自动识别数字文档版式版面中文更多>>
发文领域:自动化与计算机技术文化科学电子电信更多>>
发文期刊:《情报学报》《北京大学学报(自然科学版)》《中国图象图形学报》《中国出版》更多>>
所获基金:国家自然科学基金北京市自然科学基金国家重点基础研究发展计划国家科技支撑计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
少数民族文字文本分析与识别的研究进展
《中国图象图形学报》2024年第6期1685-1713,共29页王维兰 胡金水 魏宏喜 库尔班·吾布力 邵文苑 毕晓君 贺建军 李振江 丁凯 金连文 高良才 
国家自然科学基金项目(62166036,61772430,62266044,62236011);内蒙古自治区科技计划项目(2019GG281)。
对于少数民族古籍的保护与传承,国家予以高度重视,并强调了对这些不可再生文化资源透彻数字化的重要性。随着文档图像分析与识别技术的不断进步,对少数民族文字的文本分析与识别研究受到广泛关注,并取得显著成就,成为人工智能应用研究...
关键词:少数民族文字 文档分析与识别 印刷体文本识别 手写识别 古籍文档识别 场景文字识别 
技术驱动下数字出版及其专业建设被引量:4
《中国出版》2022年第17期16-19,共4页高良才 贾爱霞 
数字出版脱胎于传统出版,但数字出版的概念又不能仅仅局限于书报刊等传统出版物的出版,它的内涵在于知识和信息(即内容)基于互联网的数字化创作、生产、运营、传播、消费和监管。数字出版作为出版业重要板块及发展方向,其专业建设是建...
关键词:数字出版 传统出版物 出版强国 技术驱动 互联网 出版业 知识和信息 出版学科 
表格识别技术研究进展被引量:21
《中国图象图形学报》2022年第6期1898-1917,共20页高良才 李一博 都林 张新鹏 朱子仪 卢宁 金连文 黄永帅 汤帜 
国家重点研发计划资助(2019YFB1406303)。
表格广泛存在于科技文献、财务报表、报纸杂志等各类文档中,用于紧凑地存储和展现数据,蕴含着大量有用信息。表格识别是表格信息再利用的基础,具有重要的应用价值,也一直是模式识别领域的研究热点之一。随着深度学习的发展,针对表格识...
关键词:表格区域检测 表格结构识别 表格内容识别 深度学习 单元格识别 表格信息抽取 
中英文科技主题排序相关性的比较研究:以计算机领域为例被引量:2
《情报学报》2017年第9期940-953,共14页蒋卓人 高良才 赵星 刘晓钟 袁珂 汤帜 
中国博士后科学基金面上项目"面向需求变迁的异构学术信息推荐技术研究"(2016M590019);国家自然科学基金项目"版式文档中复杂异构对象的识别技术研究"(61573028)
主题排序是信息检索、信息组织等情报学核心领域的重要问题,本研究从静态全局角度和动态时间维度上对这一问题进行综合性探索,尝试以出现频率、被引次数、Page Rank值等文献计量学参量为基础,重点对中英文科技主题在各自数据集中的排序...
关键词:主题排序 比较研究 可视化 
PDF文档中的脚注识别研究
《北京大学学报(自然科学版)》2015年第6期1017-1021,共5页黎斯达 高良才 汤帜 俞银燕 
国家自然科学基金(61202232);北京市自然科学基金(4132033)资助
针对PDF文档的脚注识别问题,提出一种自动识别脚注及其引用,并建立它们之间匹配关系的方法。首先针对PDF文档提取脚注的一系列特征,包括页面布局、字体信息、语义信息等,然后基于文档部件风格一致性,利用聚类技术,处理在不同文档中相异...
关键词:脚注 PDF文档 文档分析与理解 
一种结合有监督学习的动态主题模型被引量:11
《北京大学学报(自然科学版)》2015年第2期367-376,共10页蒋卓人 陈燕 高良才 汤帜 刘晓钟 
国家自然科学基金(61202232;71271034);中央高校基本科研业务费(3132014307)资助
针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM)。该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题...
关键词:有监督学习 动态主题模型 变分推理 
版面相似中文表单的分类方法研究被引量:1
《北京大学学报(自然科学版)》2015年第2期213-219,共7页王思萌 高良才 王悦涵 李平立 汤帜 
国家自然科学基金(61202232);北京市自然科学基金(4142023)资助
针对具有相似版面的中文表单,提出一种简单有效的基于距离度量的表单分类方法,该方法对表单的用户填写信息、布局信息和位置偏移分别进行距离度量,并通过3种权重有效地降低用户填写信息的随机性、版面相似表单的布局一致性和位置抖动性...
关键词:表单分类 距离度量 权重计算 
中文电子文档的数学公式定位研究被引量:4
《北京大学学报(自然科学版)》2014年第1期17-24,共8页林晓燕 高良才 汤帜 
国家重点基础研究发展计划(2012CB724108);国家自然科学基金(61202232)资助
区别于传统基于图像和西文文档的公式定位方法,针对中文电子文档的特点,提出一种基于机器学习和规则相结合的独立公式和内嵌公式的定位方法。设计了适合中文文档的页面分行策略和词块划分规则;选择适合中文文档的公式特征和机器学习算法...
关键词:数学公式识别 数学公式定位 电子文档 中文文档 
面向H.264SVC空域-时域可伸缩编码的码率分配算法
《北京大学学报(自然科学版)》2013年第5期754-764,共11页庞燕 刘家瑛 高良才 郭宗明 
国家自然科学基金(61101078);863计划(2013AA013504);国家发展改革委员会高技术产业发展项目(发改办高技[2010]3044号)资助
提出一种面向H.264 SVC空域时域可伸缩编码的码率分配算法。通过对SVC编码过程的分析,设计了一个两阶段基于模型的码率分配算法框架。在每一阶段中沿空域或时域可伸缩性方向上,码率分配问题都被描述为一个优化问题进行求解。在充分挖掘...
关键词:H 264 SVC 层次间相关性 率失真模型 空域时域码率分配 
一种基于Gestalt原理的多连通分量形状外包络提取方法
《计算机学报》2013年第10期2070-2077,共8页吕肖庆 符松平 宋建国 高良才 汤帜 
国家"九七三"重点基础研究发展规划项目基金(2012CB724108);北京市自然科学基金资助项目(4132033)资助~~
图形识别领域的学者们正在将研究重点从简单图形转向复杂图形,其中,由多个独立图元(该文中称为连通分量)组合成的外轮廓对于复杂图形的整体分析起着至关重要的作用.该文提出了一种针对多连通分量形状提取整体外轮廓(即外包络)的方法.该...
关键词:外包络提取 多图元形状 平滑对接 Gestalt原理 图形检索 
检索报告 对象比较 聚类工具 使用帮助 返回顶部