修驰

作品数:3被引量:13H指数:2
导出分析报告
供职机构:北京工业大学计算机学院更多>>
发文主题:中文分词分词歧义无监督学习分词CRF更多>>
发文领域:自动化与计算机技术语言文字更多>>
发文期刊:《北京大学学报(自然科学版)》《计算机应用》《中文信息学报》更多>>
所获基金:国家自然科学基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
基于无监督学习的专业领域分词歧义消解方法被引量:7
《计算机应用》2013年第3期780-783,共4页修驰 宋柔 
国家自然科学基金资助项目(60872121)
中文自然语言处理中专业领域分词的难度远远高于通用领域。特别是在专业领域的分词歧义方面,一直没有找到有效的解决方法。针对该问题提出基于无监督学习的专业领域分词歧义消解方法。以测试语料自身的字符串频次信息、互信息、边界熵...
关键词:专业领域分词 分词歧义 字符串频次 互信息 边界熵 
语料库自然标注信息与中文分词应用研究(英文)被引量:2
《北京大学学报(自然科学版)》2013年第1期140-146,共7页饶高琦 修驰 荀恩东 
国家自然科学基金(60973062,61170162);中央高校基本科研业务费专项资金(2012-jbyz-001)资助
以中文分词为应用目标,将大规模语料库上存在的自然标注信息分为显性标注信息与隐性标注信息,分别考察了它们的分布和对大数据集上语言计算的影响。结果表明,两者都直接或间接地表达了作者对语言的分割意志,因而对分词具有积极的影响。...
关键词:自然标注信息 中文分词 词语抽取 大规模语料库 
基于“固结词串”实例的中文分词研究被引量:5
《中文信息学报》2012年第3期59-64,共6页修驰 宋柔 
国家自然科学基金资助项目(60872121)
近几年的中文分词研究中,基于条件随机场(CRF)模型的中文分词方法得到了广泛的关注。但是这种分词方法在处理歧义切分方面存在一定的问题。CRF虽然可以消除大部分原有的分词歧义,却会带来更多新的错误切分。该文尝试找到一种简单的、基...
关键词:中文分词 CRF 固结词串 分词歧义 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部