检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学智能技术与系统国家重点实验室计算机科学与技术系,北京100084
出 处:《中文信息学报》2005年第3期21-27,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目 (6 990 30 0 7;6 0 1730 0 8) ;国家 973基金资助项目 (G19980 30 5 0 7) ;国家 86 3计划资助项目 (2 0 0 1AA114 0 4 0 )
摘 要:不同标注体系的树库之间的相互转换是计算语言学研究的重要内容之一。本文在总结国内外几种树库标注体系及相互转换实践的基础上,结合清华汉语树库(TsinghuaChineseTreebank ,简称TCT)标注体系的特点,提出了一种将TCT从短语结构转换成依存结构(DependencyStructure)的算法。这种算法充分利用了TCT具有的功能、结构的双重标记,转换得到的依存树不仅包含了各个节点之间相互依存的层次关系,更包含了相互依存的两个节点的具体的依存关系类型。我们对转换的效果进行了抽样评估,准确率可以达到97 37%。Automatically conversion between different annotated treebank is an important subject of natural language processing. After a brief summarization of several treebank annotation schema and conversion between them, we proposed a new converting algorithm to automatically convert Tsinghua Chinese Treebank(TCT for brief) from phase structure to dependency structure. This algorithm makes full use of syntactic constituent tag and grammatical relation tag of TCT, and generates dependency structure treebank. The output dependency treebank indicates not only hierarchy dependency relationship between nodes, but also specified type of such dependency relationship. Precision of the conversion reaches 97.37%.
关 键 词:人工智能 自然语言处理 树库 短语树 依存树 自动转换
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229