检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]合肥工业大学计算机与信息学院,合肥230009 [2]安徽教育网络出版有限公司,合肥230601
出 处:《计算机工程与应用》2014年第22期158-162,共5页Computer Engineering and Applications
基 金:国家自然科学基金(No.61070220);高等学校博士学科点专项科研基金(No.20120111110001);安徽省年度重点科研计划项目(No.11070203002)
摘 要:围绕目前出版社在对数字化内容进行跨终端发布时遇到的问题,重点对PDF文档的版面信息抽取和跨终端自适应重组等技术进行研究,提出了针对PDF文档中文本、图片等信息的抽取方法和版面结构分析方法,利用终端自适应重组算法对数字化内容进行跨终端发布;以此为基础设计了一套数字内容跨终端发布的系统,并应用在出版社的实际工作中,实验结果证明了方案的可行性。Facing on the issues when the press publishes digital content across the terminals, this paper lays special stress on the research of technologies on layout information extraction and across terminal adaptive recombination for the PDF document. The methods of extraction and layout structure analysis to the texts and pictures in the PDF document are proposed. Then the terminal adaptive recombination algorithm is applied to publish the digital content across the terminals. A set of publishing system through which the digital content is published across the terminals based on the above technologies. The experimental results prove that the approach is practical in real-world application.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7