检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:林磊[1] 孙承杰[1] 张二艳[1] 刘秉权[1]
机构地区:[1]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
出 处:《广西师范大学学报(自然科学版)》2010年第1期153-156,共4页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家863计划资助项目(2007AA01Z172);国家自然科学基金面上资助项目(60673019;60673037)
摘 要:术语自动抽取是信息处理领域的基础性课题,日益受到研究者的关注。似然比方法能有效抽取低频词汇,但抽取准确率偏低。为了解决这个问题,将似然比的抽取结果用C-value进行改进。实验证明,两者相结合,在保证似然比方法高召回率的前提下,比单纯依靠似然比方法抽取准确率提高了约8%。Term extraction is a basic subject in information processing and is attracting more and more attention nowadays. In order to extract low frequency words effectively, Log-likelihood ratio method is used but with a low precision rate. To solve this problem,C-value method is used to deal with the results of Log-likelihood ratio. Experiment results show that by combining the two methods ,the precision is improved in the premise of ensuing high recall rate of Log-likelihood ratio method. The proposed method can improve the precision by about 8; compared with the Log-likelihood ratio method.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15