检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京师范大学文学院,江苏南京210097 [2]南京师范大学数学与计算机科学学院,江苏南京210097 [3]西北民族大学藏语言文化学院,甘肃兰州730030
出 处:《南京师范大学学报(工程技术版)》2008年第4期118-122,共5页Journal of Nanjing Normal University(Engineering and Technology Edition)
基 金:江苏省社会科学基金(07YYB003;06JSBYY001);国家自然科学基金(60773173);国家社会科学基金(07BYY050);国家社会科学基金2005重点项目(05AYY001);国家"973"计划(2004CB318102)资助项目
摘 要:深入分析了现有语料库的构建模式和语料库应具备的功能模块,提出基于文件系统和Clucene全文检索引擎工具包的语料库建设方案.实验证明,Clucene具有丰富的接口设计和良好的扩展性,为语料库建设提供了一种较好的技术实现方式.This paper examines deeply the constructed models of the current corpus building design and the functions corpus should have. A new corpus design based on file system and Clucene full text searching engine package is pro- posed. Experiments show that Clucene provides various types of interfaces and can be easily extended for large quantity data. These characteristics make the package a promising platform for corpus building.
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117