ISO 2022的有限状态机描述  

Finite State Machine Description of ISO 2022

在线阅读下载全文

作  者:谢谦[1] 芮建武[1] 吴健[1] 

机构地区:[1]中国科学院软件研究所开放系统与中文信息处理中心,北京100080

出  处:《中文信息学报》2006年第6期97-103,共7页Journal of Chinese Information Processing

基  金:国家863计划资助项目(2003AA1Z2110);中科院知识创新工程资助项目(KGCX2-SW-504)

摘  要:ISO 2022编码体系对字符集国家标准的制订有很大影响,然而标准条款存在不确定性,有时难于理解。本文引入有限状态机(FSM)模型来形式化地刻画ISO 2022的特征。针对FSM五元组,详细说明了其状态空间的构成,提出了输入字母表的等效分类方法,给出了初始状态以及终结状态集合,分析了状态转移函数的规模,并采用FSM描述方法分析了ISO-2022-CN、EUC-CN、复合文本等标准,揭示了这些标准与ISO 2022的内在联系。这些工作有助于ISO 2022标准符合性检测、扩展标准的制订与系统实现复杂度评估。鉴于形式化描述方法在编码字符集标准领域未得到广泛应用,本文工作为该类研究引入了新的思路和方法。The encoding system defined by ISO 2022 has pervasive effect on all sorts of national character sets, whereas a lot of uncertain entries of this standard preclude accurate comprehension to them. In this paper a finite state machine (FSM) is introduced to describe the features of ISO 2022 formally. For a 5-tuples of FSM, state set is thoroughly decomposed; input set is divided into categories; start state and acceptance state set are provided; scale of transition functions is analyzed. This FSM description method is also applied to several coded character sets, such as ISO-2022-CN, EUC-CN, and compound text, to reveal their internal relationship with ISO 2022. This work is helpful to detect the consistency of ISO 2022, to draft extended standards and to evaluate the complexity of system implementation. Being seldom used before, this formal method is a new approach to research on coded character set .

关 键 词:计算机应用 中文信息处理 编码字符集 ISO 2022 有限状态机 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象