检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王思萌[1] 高良才[1] 王悦涵[1] 李平立[1] 汤帜[1]
机构地区:[1]北京大学计算机科学技术研究所,北京100080
出 处:《北京大学学报(自然科学版)》2015年第2期213-219,共7页Acta Scientiarum Naturalium Universitatis Pekinensis
基 金:国家自然科学基金(61202232);北京市自然科学基金(4142023)资助
摘 要:针对具有相似版面的中文表单,提出一种简单有效的基于距离度量的表单分类方法,该方法对表单的用户填写信息、布局信息和位置偏移分别进行距离度量,并通过3种权重有效地降低用户填写信息的随机性、版面相似表单的布局一致性和位置抖动性对表单分类的影响。实验表明,所提方法在多个中文表单图像库上的分类准确率达到90%以上,比目前最新的表单分类方法有明显提高。The authors propose a simple but effective distance based method to identify forms with similar layouts by measuring the user filled-in data, preprinted data and dithering data. The proposed method utilizes three kinds of weight components to mitigate the impact of randomness of user filled-in data, consistency of similar layouts and position dithering respectively. Experimental results show that the proposed method can achieve more than 90% classification accuracy on a series of data sets, which is significantly better than the results of the state-of-the-artmethod.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.215