基于大规模语料的新词语识别方法被引量：5

New word identification based on large-scale corpus

出　　处：《山东大学学报（理学版）》2006年第3期89-91,共3页Journal of Shandong University(Natural Science)

基　　金：国家自然科学基金资助项目(60272084);北京市教育委员会科技发展计划重点资助项目(KZ200310772013);北京市教委资助项目(KM200510772008;KM200610772008)

摘　　要：根据新词语的不同特征,提出了一整套自动检测新词语的方法,通过大规模地统计分析,分别建立字,词,N元组的词典,从中自动检测出新词语来,然后再根据构词规则对自动检测的结果进行进一步的过滤,最终抽取出语料中的新词语.根据此方案实现的系统,可以抽取不限长度不限领域的新词语.String frequent static, sub string reduction and several faltering method are used to analyze one set Chinese new wont mining system and identify new word by using character, word and N-gram dictionary based on statistic large-scale corpus. With the system based on those methods, new word without length and domain limit can be identified.

关键词：新词语流行语语料库

分类号：TP391.2[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于大规模语料的新词语识别方法被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于大规模语料的新词语识别方法 被引量：5

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于大规模语料的新词语识别方法被引量：5