汉字切分

作品数:22被引量:112H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:施鹏飞赵宇明刘长松丁晓青江兴智更多>>
相关机构:上海交通大学清华大学北京科技大学中国科学院更多>>
相关期刊:《计算机工程与设计》《清华大学学报(自然科学版)》《上海交通大学学报》《计算机工程与应用》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划教育部人文社会科学研究基金甘肃省科技支撑计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于流水模式的古籍文献汉字切分算法被引量:6
《图书馆论坛》2021年第9期141-149,共9页倪劼 
古籍文献汉字切分作为古籍数字化基础工作之一,其中交错、粘连文字切分一直是研究的重点与难点,开展切分技术方式研究可以提高文字切分的准确性与适用性,在促进古籍数字化工作方面具有重要的意义。文章根据古籍文献汉字呈现的特征,借鉴...
关键词:古籍数字化 汉字切分 流水算法 
基于可变窗口的古代手写汉字多步切分方法被引量:6
《计算机工程与设计》2016年第4期1102-1106,共5页吴相锦 张忠林 周生龙 
教育部人文社会科学研究规划基金项目(14YJA870014);甘肃省科技支撑计划基金项目(1304FKCA066)
根据古文献和古代手写体汉字纵向书写,上下字多粘连、多重叠等特点,提出一种基于可变窗口的古代手写汉字多步切分方法。对古文献进行列切分,列切分采用投影过滤的方法,采用投影法对手写字进行粗切分,对存在粘连或重叠的字串采用可变窗...
关键词:古文献 手写汉字 列切分 汉字切分 可变窗口 切分路径 
古文献手写汉字切分方法研究被引量:4
《郑州大学学报(工学版)》2015年第6期70-75,共6页张忠林 吴相锦 周生龙 
教育部人文社会科学研究规划基金资助项目(14YJA870014)
根据古文献和古汉字的多重叠、多粘连等特点,提出了适合古文献的列切分和字切分方法.列切分采用统计投影循环过滤方法,首先对古文献进行纵向上的统计投影,然后采用循环过滤的方法对统计结果进行处理直到分离出比较均匀的列.该算法在噪...
关键词:古文献 手写汉字 汉字切分 分割算法 
基于极小阈值和曲线拟合的垂直投影汉字切分被引量:8
《中南民族大学学报(自然科学版)》2011年第4期82-85,共4页王江晴 曹卫 
国家自然科学基金资助项目(60975021)
针对传统汉字切分方法中对粘连汉字和重叠汉字切分不准确的问题,提出了基于极小阈值和曲线拟合的垂直投影汉字切分算法.该算法在传统垂直投影法汉字切分的基础上结合极小阈值和曲线拟合进行切分,实验结果表明:相对于传统汉字切分方法,...
关键词:阈值 过切分 弱切分 切分块 曲线拟合 极小值点 
基于统计的动态规划算法在联机汉字切分中的应用被引量:3
《计算机应用研究》2011年第7期2592-2594,共3页姚正斌 丁晓青 刘长松 
国家"973"计划资助项目(2007CB311004)
针对中文联机手写文本识别中需要对不同长度的切分路径进行快速合理评价的问题,提出了一种基于后验概率的动态规划代价函数计算方法,结合切分块与切分点的几何信息,利用原始切分块的个数对代价值进行加权。实验证明,该方法有效克服了不...
关键词:字符切分 动态规划 切分路径 代价函数 后验概率 
一种基于字符轮廓特征的印刷体汉字切分方法被引量:1
《合肥学院学报(自然科学版)》2008年第3期35-38,共4页周泽华 胡学友 
针对单一汉字切分方法的不足,提出一种基于字符轮廓凹凸特征的印刷体汉字切分方法,首先对扫描后的印刷体汉字文本图像进行二值化处理,根据整篇汉字字符的左右轮廓凹凸特征,把字符图像切成一个个的汉字行,最后根据每一个汉字行的字符串...
关键词:凹凸轮廓 行分割 字分割 汉字切分 
一种用于手写体汉字切分的优化模型被引量:2
《计算机工程与应用》2008年第2期227-229,共3页马洋涛 陶志穗 张金焕 杨晓伟 
国家自然科学基金( the National Natural Science Foundation of China under Grant No.10471045);广东省自然科学基金( the Natural Science Foundation of Guangdong Province of China under Grant No.031360; No.04020079);广州市天河区科技攻关项目( No.051G041) 。
在连通域单元的基础上提出了一种手写体汉字切分的优化模型,该模型可以自适应的确定部件、单个字和粘连字的宽度。另外,对粘连字的切分采用了加权k的均值法。整个切分方法既提高了算法的自适应能力,又提高了切分的正确率。实验表明这种...
关键词:连通域 最小二乘 无约束 手写体汉字切分 
一种有效解决汉语歧义切分的方法被引量:1
《计算机工程与应用》2007年第11期175-177,共3页朱鉴 张建 李淼 
中国科学院知识创新工程重要方向项目(No.KGCX2-SW-511)。
提出了一种通过有向图和统计加规则的多层过滤方法来有效解决汉语分词过程中的交集型歧义切分问题,该方法大大提高了切分的正确率。经过65000字的开放语料测试,统计了其对交集型歧义字段的切分结果,发现该方法对交集型歧义字段的切分正...
关键词:有向图 统计模型 规则库 歧义字段 汉字切分 
基于连通域的汉字切分技术研究被引量:11
《计算机应用研究》2005年第6期246-248,共3页陈艳 孙羽菲 张玉志 
字符切分技术已经成为汉字识别系统设计中的关键问题,对于质量较差的文本图像,用灰度图像取代传统的二值化黑白图像能够取得更好的切分效果,基于连通域的切分算法能够对灰度图像进行较好的切分,基于连通域的汉字切分算法能有效地对文本...
关键词:灰度图像 连通域 粘连字符切分 合并 
基于凸包像素比特征的粘连汉字切分被引量:3
《中文信息学报》2005年第1期91-97,共7页魏湘辉 马少平 
自然科学基金资助项目 (6 0 2 2 30 0 4 );国家 86 3高科技资助项目 (2 0 0 1AA114 0 82 )
汉字切分正确与否直接影响了汉字识别系统的识别率 ,粘连汉字则是切分中的难点。本文将基于背景细化的切分方法应用于《四库全书》的两字符粘连汉字数据集 ,并针对其中切分路径选择问题 ,提出了一种新特征 -凸包像素比 ,反映了在不同切...
关键词:人工智能 模式识别 粘连汉字 汉字切分 背景细化 凸包 
检索报告 对象比较 聚类工具 使用帮助 返回顶部