检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海外国语大学国际工商管理学院,上海200083 [2]中国科学院上海生命科学研究院,上海200031 [3]中国科学院上海生命科学信息中心,上海200031
出 处:《现代图书情报技术》2012年第6期36-42,共7页New Technology of Library and Information Service
基 金:上海外国语大学规划基金项目(2011年度)“多语言环境下的Web数据挖掘技术”(项目编号:2011114061);“上海外国语大学创新科研团队”(2011年度);上海市浦江人才计划项目(2009年度)“重大传染性疾病-乙型肝炎专题知识库的构建与信息挖掘整合技术的应用”;中国科学院“小百人”人才计划择优支持项目(2010年度)“重大传染性疾病-艾滋病和病毒性肝炎知识挖掘型专题文献数据库的设计与构建”的研究成果之一
摘 要:分析生命科学领域中英文混编文本的内在特点,基于控制论原理,提出一种旨在提高中英文混编文本的信息自动标引准确性的整合新方法。该方法包含三个相对独立而又相互联系的部分,即前馈控制、中期控制和反馈控制。实验表明,该新方法可以被成功应用在乙肝专题文献知识数据库的标引中,并能大幅度提高信息标引的准确性。This paper elaborates the inherent characteristics of the Chinese - English mixed text in the field of life sci- ences. On basis of the cybernetic principle, a new integrated indexing control method, which is conducted to improve the accuracy of automatic indexing for Chinese - English mixed text, is proposed in this paper. The method includes three rel- atively independent and interdependent parts, which are feed - forward control, in - progress control, and feed - back control. Subsequently, the three parts and their integrated application effectiveness for improving the indexing accuracy are introduced in detail. Experimental results show that the proposed new method is successfully applied in indexing of the lit- erature and knowledge database for Hepatitis B subject and the information indexing accuracy is greatly improved.
关 键 词:中英文混编文本 字符串匹配 自动标引准确性 控制论 乙肝专题文献知识数据库
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.116.10.73