字频统计在书目数据整理中的应用——以民国时期图书目录数据整理为例  

The Application of Chinese Character Frequency Statistics in Compiling Bibliographic Data - A Case Study of Compiling Bibliographic Data of Books of the Republic of China

在线阅读下载全文

作  者:龙向洋[1] 

机构地区:[1]复旦大学图书馆,200433

出  处:《中国索引》2016年第1期88-99,共12页Journal of the China Society of Indexers

基  金:本文为教育部人文社会科学研究一般规划课题“民国时期图书目录资料库”(项目编号为10YJA870012)研究成果.

摘  要:本文以民国时期图书目录数据整理为例,讨论书目数据库数据文本整理过程中字频统计方法的应用问题。通过在数据库内部为目录字段创建以汉字字形为单位的单字索引表,统计书目数据文本实际使用汉字频率分布情况,在此基础上进行异形字归并整理,最后通过索引关联实现书目数据文本字形的统一。数据库支持下的字频统计,可以作为书目数据文本整理的一种有效的方法。Taking compiling bibliographic data of books of the Republic of China as an example, this paper discusses applying statistical methods of Chinese character frequency in compiling text of bibliographic index based on Chinese character pattern database. Firstly, create Chinese character in the database; secondly, calculate the frequency distribution of the usage of Chinese characters in bibliographic text; thirdly, emerge and compile the characters with different forms; finally, unify the form of characters in the text of bibliographic data by index. The Chinese character frequency statistics based on database can be used as an effective method of compiling the text of bibliographic data.

关 键 词:民国文献 书目数据 字频统计 

分 类 号:G257[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象