检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:昝红英[1] 张军珲[1] 朱学锋[2] 俞士汶[2]
机构地区:[1]郑州大学信息工程学院,河南郑州450001 [2]北京大学计算语言学教育部重点实验室,北京100871
出 处:《中文信息学报》2010年第5期10-16,共7页Journal of Chinese Information Processing
基 金:国家自然科学基金资助项目(60970083);北京大学计算语言学教育部重点实验室开放课题;河南省科技创新人才杰出青年基金资助项目(104100510026)
摘 要:作者近年来从事现代汉语虚词知识库研究,并初步构建了包括副词、介词、连词、助词、语气词等的虚词用法词典、用法规则库以及用法语料库的"三位一体"现代汉语虚词知识库。该文在已有工作的基础上,进一步考察副词"就"在1998年1月《人民日报》分词与词性标注语料中的出现规律,通过规则描述、自动标注、人工校对、机器学习等方面的探索,研究副词"就"用法(包括义项)的形式化描述及其自动识别问题,并给出详细的实验结果。Focused on the knowledge base of Contemporary Chinese function words, the authors have preliminarily finished the triune knowledge base(usage dictionary, usage rule and usage corpus) of Contemporary Chinese function words, including adverbs, prepositions, conjunctions, auxiliary and modal words. This paper examines the usages of the adverb JIU in the corpus of People's Daily(Jan 1998) with segmentation and part-of-speech taggers. It provbides the adverb JIU's usages' formal description and their recognition through rule describing, automatic tagging, manual analysis, machine learning modeling, as well as detailed experimental results.
关 键 词:汉语虚词 用法规则 条件随机场 最大熵 支持向量机 自动识别
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15