石静

作品数:3被引量:45H指数:3
导出分析报告
供职机构:北京大学信息科学技术学院计算语言学研究所更多>>
发文主题:自动获取方法句子相似度大规模语料库汉语词义相似度计算方法更多>>
发文领域:自动化与计算机技术医药卫生更多>>
发文期刊:《北京大学学报(自然科学版)》《中文信息学报》《计算机研究与发展》更多>>
所获基金:国家自然科学基金国家高技术研究发展计划北京市重点实验室开放基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-3
视图:
排序:
汉语并列复句的自动识别方法被引量:7
《北京大学学报(自然科学版)》2013年第1期1-6,共6页吴云芳 石静 万富强 吕学强 
863计划(2012AA011101);九十八年度蒋经国国际学术交流基金会项目(RG013-D-09);网络文化与数字传播北京市重点实验室开放课题(ICDD201202)资助
针对汉语句际关系中分布最广泛的并列复句,提出一种自动识别的方法。通过对句子语义相似度和结构相似度的计算,使用基于词义的句子相似度计算、最大公共子串、最大谓词周边匹配长度、加重特定词语复现等方法,在广义并列关系上进行评测...
关键词:并列复句 句际关系 句子相似度 集成方法 
基于大规模语料库的汉语词义相似度计算方法被引量:25
《中文信息学报》2013年第1期1-6,80,共7页石静 吴云芳 邱立坤 吕学强 
国家863项目(No.2012AA011101);国家自然科学基金(61103089);网络文化与数字传播北京市重点实验定开放课题(ICDD301202)
词义相似度的计算是自然语言处理领域的关键问题之一,它在信息检索中的查询扩展、机器翻译中的模块识别,以及句法分析、词义消歧等任务中都发挥着重要的作用。该文研究了基于大规模语料库的汉语词义相似度计算方法,系统地比较分析了上...
关键词:词义相似度 上下文特征 权值选择 依存关系 
基于图的同义词集自动获取方法被引量:13
《计算机研究与发展》2011年第4期610-616,共7页吴云芳 石静 金澎 
国家自然科学基金项目(60703063;61003206);九十八年度蒋经国国际学术交流基金会奖助项目(RG013-D-09)
同义词集是重要的语言基础知识,基于大规模语料库的同义词集自动获取是自然语言处理领域的一项基础性研究课题.从大规模语料中自动获取有并列结构关联的词语对,据此形成图,采用Newman算法对图进行划分而自动聚类相似词语.着重研究在New...
关键词:相似词 同义词集 图模型 并列结构 Newman算法 边权值 
检索报告 对象比较 聚类工具 使用帮助 返回顶部