学术文献的文体特征及其检索意义--计算机科学文献与相关新闻报道文体的比较研究  被引量:10

Stylistic Characteristics and Retrieval of Chinese Academic Literatures: A Comparative Study on the Stylistic Characteristics between Academic Papers and Press Reports of Computer Science

在线阅读下载全文

作  者:邹永利[1] 冯静娴 郑荟[2] 

机构地区:[1] 中山大学资讯管理学院 [2] 中山大学软件学院

出  处:《中国图书馆学报》2014年第2期33-40,共8页Journal of Library Science in China

基  金:国家社会科学基金项目“网络中文学术文献的自动识别与检索研究--基于学术文献文体、链接及图文相关度的研究与系统开发”(编号:10BTQ049)的研究成果之一

摘  要:计算机科学学术文献具有独特的文体特征,且部分特征能够用于计算机科学网络中文学术文献的自动识别与检索,提高计算机科学学术文献的相对检准率。本文通过建立计算机学术文献语料库与IT新闻语料库,对计算机科学学术文献和IT新闻在特有表述、平均句长、中西文比例三方面的文体特征进行提取与加权,应用于基于百度的网络中文学术检索系统(NSIRS)中。结果显示,本研究提取并设定的文体特征能有效提高NSIRS对计算机科学学术文献的检索效率,从而证明发掘并应用特定学科文献独特的文体特征的意义。图2。表4。参考文献14。Computer science academic documents have distinctive stylistic features that can be explored to facilitate the au- tomatic identification and retrieval of Chinese computer science academic papers on the web. This paper estabhshes a computer academic literature corpus and an IT news corpus to find the different typical expressions, average length of sentences, ratio of Chinese characters to Roman alphabets, and gives them different weights. Finally, this paper applies the results to Baidu-based NSIRS system. Precision evaluation over the NSIRS shows significant advantage of our approach over previous study using tile same system. 2 figs. 4 tabs. 14 refs.

关 键 词:文体特征 计算机科学 学术文献 IT新闻 NSIRS系统 

分 类 号:G354[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象