检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:孙昊
机构地区:[1]日本同志社大学文化情报系,日本京都6100394
出 处:《东北亚外语研究》2018年第1期48-54,共7页Foreign Language Research in Northeast Asia
摘 要:本文对基于语料库挖掘的日语性别角色语言提取方法加以概述。该方法首先从日语口语语料库中抽取异性会话的文本,其次统计在异性的会话参与者中各种词汇的使用频度,最后引入特征选择方法之一的fisher精确检验的思想来抽取异性的会话中使用差异性较大的词汇。本研究将这种方法应用于日语自然会话语料库来提取性别角色语言。本研究的结果表明,除了已经被广泛接受的人称代词和终助词以外,日语中的「うん/(嗯)」「ええ/(嗯)」「ああ/(啊)」「ねー/ねえ/(表示确认)」「なあ/(啊)」「さ/(吧)」「よー/(哟)」「どー/(怎样)」「という/(表示说话,思考的内容)」等词汇可以被视为日语的性别角色语言。This article describes a corpus-based approach to Japanese gender role extraction.This method first extracts the text of the conversation between opposite gender from the Japanese oral corpus.Second,it counts the opposite gender conversation participants’frequency of use of various vocabularies.Finally,the idea of Fisher’s exact test,one of the feature selection methods,is introduced to extract the more significant vocabulary from conversations using the opposite gender.This study applies this method to Japanese natural conversation corpus to extract gender role language.The results of this study show that besides the widely accepted personal pronouns and finalizers,“un”,“ee”,“aa”,“nee”,“naa”,“sa”,”you”,“dou”,“toiu”,can be treated as Japanese gender role language.
关 键 词:角色语言 语料库挖掘 卡方检验 fisher精确检验1
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7