检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《清华大学学报(自然科学版)》2002年第7期869-872,共4页Journal of Tsinghua University(Science and Technology)
基 金:国家自然科学基金资助项目 (60 172 0 2 7)
摘 要:为了在视频图像中进行字幕信息的实时提取 ,提出了一套简捷而有效的方法。利用视频图像中文本的频率特性与空间连续性 ,采用改进的投影阈值分割方法对视频中的文本进行实时分割。针对视频字幕在时间上的冗余特性 ,提出了一个基于有限状态机的动态缓冲的模型 ,在提高分割的正确率的同时减小了识别运算量。在识别部分 ,采用了一个 3层前向神经网络进行实时的识别。该算法已经成功地应用于卡拉 OK MTV歌词字幕信息同步提取系统中。A simple and effective method is presented for real time text segmentation and recognition in videos. The frequeny and spatial characteristics of the text are analyzed by a fast segmentation algorithm developed from the conventional threshold method. A dynamic buffering algorithm based on the Finite State Machine is used to eliminate the text's temporal redundancy and at the same time to correct segmentation errors. The recognition algorithm employs a 3 layer BP NN for real time recognition. The algorithms have been successfully applied to a system which automatically extracts lyrics from MTV Karaoke videos.
关 键 词:视频信号 图像分割 视频图像识别 动态缓冲 分裂合并 特征提取
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112