江苏省自然科学基金(BK20130587)

作品数:11被引量:142H指数:6
导出分析报告
相关作者:王昊邓三鸿苏新宁吴志祥朱惠更多>>
相关机构:南京大学更多>>
相关期刊:《情报理论与实践》《情报学报》《图书情报工作》《数据分析与知识发现》更多>>
相关主题:本体学习中文专利条件随机场术语抽取OWL更多>>
相关领域:自动化与计算机技术文化科学医药卫生更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于奇异值分解的专利术语层次关系解析研究被引量:6
《情报学报》2017年第5期473-483,共11页吴志祥 王昊 王雪颖 祁磊 苏新宁 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587);江苏省"333"工程项目"面向知识服务的中文本体学习研究"(BRA2015401);国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)
奇异值分解是矩阵分析中常用的分解技术,在高维数据的降维、去噪方面有着广泛的应用。本文将矩阵的奇异值分解技术应用到领域专利术语的层次关系解析中,其核心思想是术语语义空间的深度转换,旨在用某种潜在特征代替文档作为属性来表示...
关键词:术语语义空间转换 矩阵奇异值分解 术语特征抽取 术语层次关系 本体学习 
中文专利术语层次关系解析研究被引量:7
《情报学报》2017年第4期401-410,共10页吴志祥 王昊 王密平 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587);江苏省"333"工程项目"面向知识服务的中文本体学习研究"(BRA2015401);国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)
对非结构化专利文本中的领域术语进行抽取以及语义关系的解析是挖掘蕴藏在专利文献中的丰富知识,并进行深入应用的前提。本文在领域专利术语有效抽取的基础上,探讨并实现较大规模术语层次关系的解析,构建了含有层次关系的领域知识本体...
关键词:中文专利术语 位置加权 PCA降维 类目标签抽取 术语层次关系 本体学习 
中文文本聚类常用停用词表对比研究被引量:53
《数据分析与知识发现》2017年第3期72-80,共9页官琴 邓三鸿 王昊 
中国地震局星火计划攻关项目"面向地震应急的空间智能决策方法研究"(项目编号:XH15019);江苏省自然科学基金项目"面向专利预警的中文文本学习研究"(项目编号:BK20130587)的研究成果之一
【目的】通过实验对比分析,比较不同停用词表对于不同类型的文本数据的作用效果,对停用词表的构建与使用提供参考意见。【方法】选取百度停用词表、哈尔滨工业大学停用词表以及四川大学机器智能实验室停用词表,基于三个不同语料库运用...
关键词:文本聚类 停用词 K—means 
面向本体学习的中文专利术语抽取研究被引量:18
《情报学报》2016年第6期573-585,共13页王昊 王密平 苏新宁 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(BK20130587);国家社科重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(13&ZD174)等的资助
本文提出了一个无或少训练语料环境下抽取中文专利术语的解决方案。以"钢铁冶金"领域专利文本为例,首先总结了该领域中文术语的基本特征,进而建立了基于字角色标注的机器学习术语识别模型,并通过循环迭代方式重复条件随机场的学习过程,...
关键词:中文专利术语 机器学习 条件随机场 字角色标注 循环迭代 合成规则 本体学习 
基于CRFs的冶金领域中文专利术语抽取研究被引量:13
《现代图书情报技术》2016年第6期28-36,共9页王密平 王昊 邓三鸿 吴志祥 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(项目编号:BK20130587);江苏省"333"工程项目"面向知识服务的中文本体学习研究"(项目编号:BRA2015401)的研究成果之一
【目的】探讨冶金领域中文专利术语抽取模型的最优条件,用于有效地抽取冶金领域专利术语。【方法】使用尚不完善的核心语料库,在无需人工标引的情况下,采用条件随机场(CRFs)构建字角色标注的冶金领域中文专利术语识别模型。详细说明模...
关键词:中文专利术语 条件随机场 术语抽取 序列标注 
中文领域专业术语层次关系构建研究被引量:1
《现代图书情报技术》2016年第1期73-80,共8页朱惠 杨建林 王昊 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(项目编号:BK20130587);中央高校基本科研业务费专项资金项目"我国图书情报学科知识结构及演化动态研究"(项目编号:20620140645)的研究成果之一
【目的】对如何从中文非结构化文本获取术语的层次关系进行探讨。【方法】从CNKI获取数字图书馆学科领域文献,通过术语抽取、术语向量空间模型构建、BIRCH算法聚类和聚类标签确定构建术语的语义层次结构。【结果】构建数字图书馆领域术...
关键词:术语 层次关系 本体 本体学习 聚类 
基于形式概念分析的学科术语层次关系构建研究被引量:14
《情报学报》2015年第6期616-627,共12页王昊 朱惠 邓三鸿 
国家社科重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”(12&ZD221);江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(BK20130587)等的资助
本体是领域知识的有效组织和描述,本体学习则是实现本体自动构建的方法体系和技术集合。本文以本体学习理论为指导,提出了一种以文档一术语空间为核心、形式概念分析(FCA)为手段的中文领域本体层次结构自动构建的有效方法,并以“...
关键词:学科术语 层次关系 本体学习 形式概念分析 概念格OWL 
中文短文本自动分类中的汉字特征优化研究被引量:4
《情报理论与实践》2015年第6期121-127,共7页王昊 邓三鸿 苏新宁 
国家社会科学基金重大招标项目"面向突发事件应急决策的快速响应情报体系研究"(项目编号:13&ZD174);江苏省自然科学基金青年项目"面向专利预警的中文本体学习研究"(项目编号:BK20130587)的成果
采用含语义的词语或篇幅更长的语言片段作为中文短文本的特征描述存在明显的可操作性问题。文章综合探讨了汉字特征在中文短文本分类计算中的可行性以及影响规律,比较了关键词、词语和汉字的类目区分能力,认为后者的分类效果略低于篇幅...
关键词:短文本 文本分类 汉字特征 自动分类 优化 
中文医学专业术语的层次结构生成研究被引量:4
《情报学报》2014年第6期594-604,共11页王昊 苏新宁 朱惠 
江苏省自然科学基金项目“面向专利预警的中文本体学习研究”(BK20130587);国家社科重大招标项目“面向学科领域的网络信息资源深度聚合与服务研究”(12&ZD221)资助
本文基于术语共现理论,利用形式概念分析中概念格的自动生成来推理作为属性的领域专业术语的层次结构并进行可视化展示,进而提出了一整套用于实现领域本体概念层次关系构建的解决方案,具体包括文档/词汇与术语语义关联的识别、领域...
关键词:医学专业术语 层次结构 本体学习 文档术语矩阵 词汇术语矩阵 形式概念分析 OWL 
基于CNKI的本体学习领域科学评价研究被引量:1
《图书情报工作》2014年第S1期174-178,188,共6页韩杰冰 王昊 
江苏省自然科学基金项目"面向专利预警的中文本体学习研究"(项目编号:BK20130587)研究成果之一
以CNKI为数据来源,检索2003-2012年10年间本体学习领域的相关文献,结合其外部特征和内容特征,基于多维结构分析方法从时间、期刊、作者(包括领域核心作者、作者机构分布和作者地域分布)和基金4个维度,运用科学计量的方法分析评价我国近...
关键词:本体 本体学习 CNKI 研究状况 文献计量 
检索报告 对象比较 聚类工具 使用帮助 返回顶部