藏文自动分词系统的设计与实现  被引量:51

The Design and Implementation of a Tibetan Word Segmentation System

在线阅读下载全文

作  者:陈玉忠[1] 李保利[1] 俞士汶[1] 

机构地区:[1]北京大学计算语言学研究所,北京100871

出  处:《中文信息学报》2003年第3期15-20,65,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目 ( 696630 0 1);973资助项目 (G19980 30 5 0 7- 4 )

摘  要:藏文自动分词系统的研制目前在国内仍是空白。本文从四个方面详细报告了书面藏文自动分词系统的具体实现过程 ,内容包括系统结构、分词知识库的组织与实现以及分词策略、算法设计及其详细的自动分词过程实例。文章最后给出了实验结果 ,结果表明系统具有较高的切分精度和较好的通用性。Word segmentation for Tibetan has not been well studied yet. This paper reports a Tibetan word segmentation system that we designed and implemented. Several issues about the system are explained, which include system architecture, knowledge bases, segmentation strategy, and algorithms. In preliminary experiments, the system demonstrates higher accuracy and domain independency.

关 键 词:计算机应用 中文信息处理 格助词 接续特征 藏文 自动分词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象