唐宋诗之计算机辅助深层研究  被引量:24

The Computer Aided Research Work of Chinese Ancient Poems

在线阅读下载全文

作  者:胡俊峰[1] 俞士汶[1] 

机构地区:[1]北京大学计算机科学技术系北京大学计算语言学研究所,北京100871

出  处:《北京大学学报(自然科学版)》2001年第5期727-733,共7页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:1998-1999国家社会科学基金 (98BYY0 2 2 );北京大学 985计划资助项目

摘  要:介绍了北大计算语言学研究所开发的“唐宋诗计算机辅助研究系统”。该系统以全唐诗(481万字 )和宋代部分名家诗 (16 0万字 )组成的语料库为基础 ,运用计算语言学方法对唐宋诗进行分析研究 ,提取了唐宋诗中的词汇 ,计 5万余条目。在对诗文进行词语切分的基础上 ,建立了词汇的共现关系、对仗关系以及词汇的作者分布特征信息。系统除了提供面向诗文内容的全文检索功能外 ,还进一步开发了基于词汇的统计分析和诗句相似性检索等功能 。Based on 6.4 million chars of Chinese ancient poetry,the “Computer aided research system of Chinese ancient poems” provides a word\|based analysis platform of Chinese ancient poems.More than 50?000 Chinese words,including 40?814 multi\|char words,were extracted from the corpora via statistic method.Besides the full text retrieving function,the system also provide word\|based statistic analysis,sentence based similarity retrieving,automatic Pinyin tagging and some other useful functions to benefit the profound analysis of the Chinese ancient poems.The National Social Science Foundation of China 1998_1999 funded the project.

关 键 词:语料库语言学 未登录词发现 自动注音 唐宋诗计算机辅助研究系统 计算语言学 汉语信息处理 

分 类 号:H087[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象