中文期刊论文数据采集技术研究  

Research on Data Acquisition Technology of Chinese Periodical Papers

在线阅读下载全文

作  者:李家辰 张一凡 旷远有 张雪海 沈沂亭 LI Jia-chen;ZHANG Yi-fan;KUANG Yuan-you;ZHANG Xue-hai;SHEN Yi-ting(School of Information Science and Technology,North China University of Technology,Beijing 100144,China)

机构地区:[1]北方工业大学信息学院

出  处:《电脑知识与技术》2019年第12Z期188-189,203,共3页Computer Knowledge and Technology

基  金:北京市大学生科学研究与创业行动计划资助

摘  要:等结构化数据的方法。该方法可以对中文期刊论文的PDF文件或图像文件进行分析处理,自动形成一些结构化的图像块数据,最终转化为结构化的文字数据,以帮助用户准确地获取或检索论文信息。实验结果表明,本方法对中文期刊论文进行数据采集具有一定的有效性。and oth⁃er structured data.This method can analyze and process PDF files or image files of Chinese periodical papers,automatically form some structured image block data,and finally convert it into structured text data,so as to help users accurately obtain or retrieve paper infor⁃mation.Experimental results show that the method is effective in data collection of Chinese journal papers.

关 键 词:图像处理 版面分析 投影法 中文期刊 

分 类 号:TP317[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象