石晶

作品数:14被引量:169H指数:6
导出分析报告
供职机构:长春工业大学计算机科学与工程学院更多>>
发文主题:文本分割LDA模型无指导学习主题分析知网更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机应用与软件》《计算机应用研究》《中文信息学报》《计算机学报》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划博士科研启动基金吉林省科技发展计划基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
无指导学习语义优选被引量:1
《计算机应用与软件》2012年第1期155-158,216,共5页李东明 张丽娟 赵伟 石晶 
吉林省科技发展计划项目青年基金(20100155);吉林省科研发展计划科技支撑重点项目(20100214)
给出基于LSC模型的EM方法进行汉语语义优选的学习。具体步骤是首先随机为参数模型赋予初值;然后迭代运行EM算法,直到收敛;最后计算动词和名词的语义关联度,以此衡量其搭配的可能性。大量实验结果表明LSC模型能够较好地体现动、名词的搭...
关键词:语义优选 潜在语义聚类 无指导学习 
基于MDL和LSC的语义优选方法
《计算机工程》2011年第17期15-18,共4页李东明 张丽娟 赵伟 石晶 
吉林省科研发展计划科技支撑基金资助重点项目(20100214);吉林省科技发展计划青年基金资助项目(20100155)
为实现谓语动词对论元的自动选择,提出基于最小描述长度(MDL)和潜在语义聚类(LSC)的语义优选方法。基于MDL原则计算与动词搭配的名词的δsc值,根据LSC模型的EM算法求取动、名词的搭配概率P(v,n),并针对每一对动、名词计算δsc和P(v,n)之...
关键词:语义优选 最小描述长度 潜在语义聚类 无指导学习 期望极大化 
基于LDA模型的主题词抽取方法被引量:47
《计算机工程》2010年第19期81-83,共3页石晶 李万龙 
长春工业大学博士基金资助项目(2008A02)
以LDA模型表示文本词汇的概率分布,通过香农信息抽取体现主题的关键词。采用背景词汇聚类及主题词联想的方式将主题词扩充到待分析文本之外,尝试挖掘文本的主题内涵。模型拟合基于快速Gibbs抽样算法进行。实验结果表明,快速Gibbs算法的...
关键词:LDA模型 GIBBS抽样 主题词抽取 
汉语语义分析方法研究被引量:4
《计算机应用研究》2010年第2期529-531,共3页石晶 李万龙 
提出汉语语义分析的方法,具体策略是借用依存语法作为表示框架,通过在基本内部—外部算法中结合知识识别句子中的依存关系。实验结果说明,利用借助知识的内部—外部算法训练无指导模型是可行的汉语语义分析方法。
关键词:依存分析 内-外算法 无指导学习 
基于LDA模型的主题分析被引量:34
《自动化学报》2009年第12期1586-1592,共7页石晶 范猛 李万龙 
长春工业大学博士基金(2008A02)资助~~
在文本分割的基础上,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来,主题以词串的形式表示.为了分析准确,利用LDA(Latent dirichlet allocation)为语料库及文本建模,以Clarity度量块间相似性,并通过局部最小值识别片...
关键词:主题分析 LDA模型 文本分割 GIBBS抽样 
三种主题分割方法的对比研究被引量:2
《计算机工程与应用》2009年第18期135-138,151,共5页石晶 李万龙 
长春工业大学博士基金(No.2008A02)
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用。基于PLSA及LDA模型的文本分割试图使隐藏于片段内的不同主题与文本表面的词、句对建立联系,而基于小世界模型的分割则依据小世界模型的短路径、高...
关键词:文本分割 概率潜在语义分析模型 LDA模型 小世界模型 
利用知网扩展内部-外部算法
《现代图书情报技术》2009年第7期54-58,共5页石晶 张丽娟 
提出结合知网的知识对内部-外部算法予以扩展,并利用扩展的内部-外部算法实现汉语的语义依存分析。实验结果表明,扩展的内部-外部算法克服原有算法的诸多弊病,包括训练代价昂贵、局部极值问题以及与语言学家的分析结果不符等。
关键词:内部-外部算法 语义的依存分析 无指导学习 
基于LDA模型的文本分割被引量:55
《计算机学报》2008年第10期1865-1873,共9页石晶 胡明 石鑫 戴国忠 
国家“九七三”重点基础研究发展规划项目基金(2002CB312103);国家自然科学基金(60503054);中国科学院软件研究所创新工程重大项目资助~~
文本分割在信息提取、文摘自动生成、语言建模、首语消解等诸多领域都有极为重要的应用.基于LDA模型的文本分割以LDA为语料库及文本建模,利用MCMC中的Gibbs抽样进行推理,间接计算模型参数,获取词汇的概率分布,使隐藏于片段内的不同主题...
关键词:文本分割 LDA模型 相似性度量 边界识别 
基于知网的词汇集聚分析
《现代图书情报技术》2008年第9期41-46,共6页石晶 戴国忠 
词汇集聚提供了文本的结构启示,因而在许多自然语言处理中有极为重要的应用。介绍基于知网分析词汇集聚的方法,首先利用语义网络的形式将知网知识表示出来;然后在文本概念间有引导地建立推理路径;最后基于路径搜索形成体现集聚的词汇链...
关键词:词汇集聚 语义网络 文本推理 
基于小世界模型的中文文本主题分析被引量:9
《中文信息学报》2007年第3期69-75,共7页石晶 胡明 戴国忠 
国家973重点基础研究发展规划资助项目(2002CB312103);国家自然科学基金资助项目(60503054);中国科学院软件研究所创新工程重大项目资助
本文旨在研究如何基于小世界模型进行文本分割,确定片段主题,进而总结全文的中心主题,使文本的主题脉络呈现出来。为此首先证明由文本形成的词汇共现图呈现短路径,高聚集度的特性,说明小世界结构存在于文本中;然后依据小世界结构将词汇...
关键词:计算机应用 中文信息处理 主题分析 小世界模型 文本分割 词汇聚类 
检索报告 对象比较 聚类工具 使用帮助 返回顶部