检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学软件学院,南京210093 [2]南京大学计算机软件新技术国家重点实验室,南京210093
出 处:《计算机应用》2011年第1期50-52,57,共4页journal of Computer Applications
摘 要:由于图形和文字的笔画构成复杂程度存在差异,通过计算组成图形和文字笔画的信息熵值度量该差异性,进行图文类型判别;自适应重采样解决了固定间距重采样机制可能导致的信息熵值随文档笔画尺寸变化而出现较大变化的问题,使方法能够适应不同用户的书写习惯;基于对称性检验的后处理可解决笔画构成等价导致信息熵值十分接近的图形和文字的判别。实验结果验证了所提方法的有效性。As the stroke constitutional complexity of shapes and texts is different, this paper proposed a shape and text separation method based on the calculation of the entropy of the strokes. Because the entropy of a document may vary with stroke size, adaptive resampling was introduced to handle different writing stroke sizes. In addition, the paper employed a symmetrical judgement mechanism to handle the separation of texts and shapes with equivalent stroke constitutions. The experimental results demonstrate the effectiveness of the proposed method.
关 键 词:图文类型判别 笔画信息熵 自适应重采样 对称性检验
分 类 号:TP391.41[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222