检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京师范大学国际文化教育学院,江苏南京210097 [2]南京师范大学文学院,江苏南京210097
出 处:《南京师范大学文学院学报》2013年第3期175-182,共8页Journal of School of Chinese Language and Culture Nanjing Normal University
基 金:江苏省教育厅高校哲学社会科学基金项目(编号:2011SJB740010);教育部人文社会科学研究项目(编号:12YJCZH121);江苏高校重点研究基地重大项目(编号:2010JDXM023);"江苏高校优势学科建设工程资助项目"资助
摘 要:自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达到了较高的水平。在用不同的方法对《孟子》进行自动分词时,在词语F值的统计指标外,首次尝试引入了小句F值这一统计指标。The automatic word segmentation is a basic subject in Chinese language information processing. This paper discusses the automatic word segmentation technology applied in the pre - Qin text Mencius. It is based on condition random field statistic model and utilizes the relevant ancient annotations and comments. The effect of these two methods is significant. The F values of both words and short sentences have reached higher levels. When using different method in automatic segmentation on Mencius, we are the first to introduce the statistic indicator of the F value of short sentences besides that of words.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31