检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《天津工程师范学院学报》2009年第3期25-29,共5页Journal of Tianji University of Technology and Education
基 金:河南省科技攻关项目(0324500015)
摘 要:在对DVD的内容进行管理和检索时,需要针对字幕文本进行处理,因此需要对DVD字幕流图片中的文本进行提取和识别,以获得纯文本数据。文章通过对DVD文件结构和字幕流数据存储结构的研究和分析,描述了字幕、私有流1和VOB文件的结构以及访问技术;针对英文字幕,提出了一种DVD字幕流分离、图片提取与解码、字符分割、样本训练以及文本识别的基本方法。通过简单的数据训练,就可使用该方法快速完成DVD英文字幕文本的自动生成。To archive and manage DVD contents, it is necessary to process subtitles text. In order to get plain text data from subtitles, the characters in subtitle pictures have to be extracted and recognized. Based on researching and analyzing of DVD file organization mechanism and data storage structure of subtitle streams, the interfaces of accessing subtitles, private stream 1 and VOB files are explained. The method of separating and extracting English subtitles is presented in this paper. Five steps are used to separate DVD subtitle stream, extract subtitle pictures, split characters, and train samples & recognize text. An implementation of this method can get English subtitle text automatically after simple training.
分 类 号:TP391.43[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145