副词“就”的用法及其自动识别研究  被引量:6

Research on Usages of Chinese Adverb JIU and Its Automatic Indentification

在线阅读下载全文

作  者:昝红英[1] 张军珲[1] 朱学锋[2] 俞士汶[2] 

机构地区:[1]郑州大学信息工程学院,河南郑州450001 [2]北京大学计算语言学教育部重点实验室,北京100871

出  处:《中文信息学报》2010年第5期10-16,共7页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60970083);北京大学计算语言学教育部重点实验室开放课题;河南省科技创新人才杰出青年基金资助项目(104100510026)

摘  要:作者近年来从事现代汉语虚词知识库研究,并初步构建了包括副词、介词、连词、助词、语气词等的虚词用法词典、用法规则库以及用法语料库的"三位一体"现代汉语虚词知识库。该文在已有工作的基础上,进一步考察副词"就"在1998年1月《人民日报》分词与词性标注语料中的出现规律,通过规则描述、自动标注、人工校对、机器学习等方面的探索,研究副词"就"用法(包括义项)的形式化描述及其自动识别问题,并给出详细的实验结果。Focused on the knowledge base of Contemporary Chinese function words, the authors have preliminarily finished the triune knowledge base(usage dictionary, usage rule and usage corpus) of Contemporary Chinese function words, including adverbs, prepositions, conjunctions, auxiliary and modal words. This paper examines the usages of the adverb JIU in the corpus of People's Daily(Jan 1998) with segmentation and part-of-speech taggers. It provbides the adverb JIU's usages' formal description and their recognition through rule describing, automatic tagging, manual analysis, machine learning modeling, as well as detailed experimental results.

关 键 词:汉语虚词 用法规则 条件随机场 最大熵 支持向量机 自动识别 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象