英日语料库语义接受度对比研究  被引量:3

Comparative study on semantic accessibility scale originating from English and Japanese corpora

在线阅读下载全文

作  者:杜家利[1] 于屏方[1] 

机构地区:[1]鲁东大学外国语学院汉语言文学院,山东烟台264025

出  处:《计算机工程与应用》2009年第24期146-149,共4页Computer Engineering and Applications

基  金:国家社会科学基金项目(No08BYY046);山东省社会科学规划项目(No07CWXJ03)

摘  要:基于语料库的语义接受度(SAS)研究是在线衡量文本理解程度的可行性方法。在大规模真实文本语料的基础上,利用赋值限域方法进行英日文本对照研究。并通过分析不同赋值区间对英日小说文本语义接受度进行解读。经过验证的语义接受度公式证明了文本理解与词汇密度(P1,P2)、词长(H)和句长(L)相关,即SAS=P2/[P1×0.4×(L+H)],而且不同的抽取率不会引起评价值的显著差异。此公式为文学研究者借助网络对电子文本进行理解度评价提供了理论支持。The corpus-based study on Semantic Accessibility Scale(SAS) is a useful method to evaluate the acceptance of electronic texts.On the basis of large-scale natural language texts,this paper compares The Old Man and the Sea and "ゆきぐに" from English and Japanese corpora by means of the information retrieval and semantic assignment.A conclusion is drawn that SAS is related to vocabulary density(P1,P2),vocabulary length(H) and sentence length(L),namely SAS=P2/[P1×0.4×(L+H)].Correspondingly,different sampling ratios will not result in fundamental difference of SAS.This study provides the theoretical support for the literary critics to analyze the acceptance of internet-based texts.

关 键 词:文本 语料库 自然语言 语义接受度 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象