并行文本管理原型系统PDoc的功能与总体框架  被引量:1

Function and architecture of a parallel document management system PDoc

在线阅读下载全文

作  者:李建中[1] 杨艳[2] 张艳秋[1] 

机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001 [2]黑龙江大学计算机科学技术学院,黑龙江哈尔滨150080

出  处:《哈尔滨工业大学学报》2004年第9期1139-1143,共5页Journal of Harbin Institute of Technology

基  金:国家自然科学基金资助项目(60273082);国家高技术研究发展计划资助项目(2001-AA-415-410);国家重点基础研究发展规划资助项目(G1999032704).

摘  要:为了探讨如何存储和管理大量的文本信息并提供方便的查询,建立了一个支持数字图书馆的并行文本数据管理原型系统,给出了PDoc系统的功能和总体框架.PDoc的功能包括文本数据采集、格式标准化、信息提取、自动分类、数据加载、数据分布、查询等.系统既提供了管理员维护界面,又针对不同用户提供了多个基于internet的查询界面,使系统管理员和普通用户都能方便地通过界面实现各种查询和维护操作.In order to discuss how to store and manage the large amount of documents and how to support query efficiently, a parallel document management system is founded which supports the digital library applications, and the function and architecture of PDoc system are given. The function of PDoc includes data collection, format normalization, information extraction, automatic classification, data loading, data distribution, query, etc. The system provides a manager interface and a user interface, which makes the system easy to use.

关 键 词:并行数据处理 文本 数字图书馆 

分 类 号:TP311.132[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象