话题型微博中的人称代词特征及消解策略  

On the Features of Personal Pronoun in the Chinese Topic-Oriented Microblog and Resolution Strategies

在线阅读下载全文

作  者:张瑛[1] 梁琳琳[1] 侯敏 滕永林 

机构地区:[1]中国传媒大学文学院,北京100024 [2]国家语言资源监测与研究中心有声媒体中心,北京100024

出  处:《海南大学学报(人文社会科学版)》2014年第2期119-126,共8页Journal of Hainan University (Humanities & Social Sciences)

摘  要:通过分析中文话题型微博的文本特点以及人称代词的分布特征,指出该类微博是一种特殊的多人会话文本,其人称代词具有词型较少、各类人称代词使用比重差异较大、用法不规范、常出现泛指与外指等特点,并依据这些特点,提出去伪、特殊命名实体提取、建立话题语用表单、多层面语言信息提取等策略,以及相应的消解方法。实验结果证明该方法可取得较好的效果。This paper, analyzing the textual features and the distribution of personal pronouns in Chinese topic- oriented microblog, holds that this type of microblog is a special multi-lateral discourse text. The personal pro- nouns show such features as less types, great difference in use percentage, irregular usage, more generic refer- ence and exophora and so on. According to these features, the study proposes some strategies including the fake- removing, the extraction of special naming entity, the establishment of topic-centered sheet and the multi-level abstraction of language information, as well as the corresponding resolutions. The test proves that the strategies can ensure the better effects.

关 键 词:话题型微博 人称代词 指代功能分类 消解 

分 类 号:H109.4[语言文字—汉语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象