关键词提取技术在撒拉族文献数据库的应用  

Application of keyword extraction technology in Salar literature database

在线阅读下载全文

作  者:赵建飞[1] 段新文[1] 安守春[1] 

机构地区:[1]青海师范大学物理系,青海西宁810008

出  处:《现代电子技术》2013年第24期5-7,共3页Modern Electronics Technique

基  金:国家社会科学基金资助项目:撒拉族文献资料数据库的建设研究(11XTQ011)

摘  要:在文献管理和研究中经常会做关键词提取的工作,通过人工的方式进行提取过程繁杂,工程量极大,因此引入一种关键词欲提取的方式,其过程主要采用以下三个步骤:先通过OCR系统对图片进行识别、排错;再通过词频技术,来提取词频及关联性最高的关键词,将其作为备选关键词;然后通过人为阅读的方式,按照一定的关键词人工提取规则进行关键词的精确提取。结果表明,该方法取得了较好的效果。The keyword extraction work is often done in the literature management. The artificial extraction may cause a complex process, and the work burden is heavy. A method of keyword pre-extraetion is introduced, which is mainly divided into three steps: the image recognition and troubleshooting are conducted first by OCR system; the word frequency technology is used to extract the word frequency and highest relevance keywords as alternative keywords; and then through man-made reading manner, the accurate extraction of keywords is achieved in accordance with a certain keyword manual extraction rule.

关 键 词:关键词提取 撒拉 词频 引用度 

分 类 号:TN911-34[电子电信—通信与信息系统]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象