检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京信息科技大学网络文化与数字传播北京市重点实验室,北京100101 [2]北京信息科技大学计算机学院,北京100101
出 处:《计算机工程与设计》2016年第5期1239-1244,共6页Computer Engineering and Design
基 金:北京市属高等学校创新团队建设与教师职业发展计划基金项目(IDHT20130519);数字出版技术国家重点实验室开放课题基金项目(BX9161123405)
摘 要:为解决以往流式文档中逻辑结构重构方法的不足,提出一种基于有向图的流式文档逻辑结构重构方法。从模板文档中提取逻辑结构,在此基础上,通过对待查文档中的逻辑标签进行筛选建立有向图,利用有向图的单源最短路径算法过滤多余的逻辑结构,得到最佳的文档逻辑结构。实验结果表明,该算法能够有效改善逻辑结构识别的准确性,对于文档内容理解和自动化排版与格式检查等应用具有重要意义。To solve the shortcomings of logical structure reconstruction of re-flowable document,the algorithm based on a directed graph was put forward to improve the previous algorithms.The logical structure was extracted from the template document,and the directed graph was constructed by sieving logic tags of document to be searched.In addition,the single source shortest path algorithm was applied to filter out redundant logic tags to get the optimal document logical structure.The results show that the algorithm can effectively improve the accuracy of logical structure recognition,which forms the foundation of document content understanding,automatic typesetting and format checking,etc.
关 键 词:逻辑结构重构 逻辑标签 自动排版格式检查 流式文档 单源最短路径
分 类 号:TP302[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49