国家自然科学基金(69433010)

作品数:2被引量:123H指数:2
导出分析报告
相关作者:左正平黄昌宁孙茂松刘定强更多>>
相关机构:清华大学北京信息工程学院更多>>
相关期刊:《中文信息学报》更多>>
相关主题:汉语自动分词中文信息处理OCR技术版面分析汉字识别更多>>
相关领域:语言文字自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-2
视图:
排序:
基于组件的中文版面分析被引量:5
《中文信息学报》2000年第2期8-13,共6页刘定强 张炘中 
国家自然科学基金资助!(合同号 :6 94 330 10 )
本文提出基于组件的中文版面分析方法。本方法是以自底向上为主 ,同时结合了自顶向下和基于组件的思想。基于组件的思想使得算法结构清晰、图象扫描次数被尽可能地减少 ;以自底向上为主、同时结合自顶向下的方法具有效率高、准确性高、...
关键词:版面分析 自底向上 组件 汉字识别 OCR技术 
汉语自动分词词典机制的实验研究被引量:118
《中文信息学报》2000年第1期1-6,共6页孙茂松 左正平 黄昌宁 
国家自然科学基金资助!(合同号:69433010)
分词词典是汉语自动分词系统的一个基本组成部分。其查询速度直接影响到分词系统的处理速度。本文设计并通过实验考察了三种典型的分词词典机制:整词二分、TRIE 索引树及逐字二分,着重比较了它们的时间、空间效率。实验显示:基于逐字二...
关键词:中文信息处理 汉语自动分词 分词词典机制 
检索报告 对象比较 聚类工具 使用帮助 返回顶部