DVD字幕提取与文本自动识别技术研究  被引量:3

Research on DVD subtitles extraction and text automatic recognition technology

在线阅读下载全文

作  者:张晓民[1] 刘黎明[1] 

机构地区:[1]南阳理工学院软件学院,河南南阳473004

出  处:《天津工程师范学院学报》2009年第3期25-29,共5页Journal of Tianji University of Technology and Education

基  金:河南省科技攻关项目(0324500015)

摘  要:在对DVD的内容进行管理和检索时,需要针对字幕文本进行处理,因此需要对DVD字幕流图片中的文本进行提取和识别,以获得纯文本数据。文章通过对DVD文件结构和字幕流数据存储结构的研究和分析,描述了字幕、私有流1和VOB文件的结构以及访问技术;针对英文字幕,提出了一种DVD字幕流分离、图片提取与解码、字符分割、样本训练以及文本识别的基本方法。通过简单的数据训练,就可使用该方法快速完成DVD英文字幕文本的自动生成。To archive and manage DVD contents, it is necessary to process subtitles text. In order to get plain text data from subtitles, the characters in subtitle pictures have to be extracted and recognized. Based on researching and analyzing of DVD file organization mechanism and data storage structure of subtitle streams, the interfaces of accessing subtitles, private stream 1 and VOB files are explained. The method of separating and extracting English subtitles is presented in this paper. Five steps are used to separate DVD subtitle stream, extract subtitle pictures, split characters, and train samples & recognize text. An implementation of this method can get English subtitle text automatically after simple training.

关 键 词:DVD 私有流 字幕流 VOB OCR 

分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象