刘蔷

作品数:4被引量:24H指数:3
导出分析报告
供职机构:中国石油大学(北京)地球物理与信息工程学院更多>>
发文主题:信息抽取KNN分类算法KNN信息熵背景知识更多>>
发文领域:自动化与计算机技术更多>>
发文期刊:《计算机工程与设计》《计算机应用与软件》《山东大学学报(理学版)》更多>>
所获基金:国家科技重大专项更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-4
视图:
排序:
科技文献的实验语料句抽取方法被引量:2
《计算机工程与设计》2016年第11期3086-3091,共6页朱丽萍 刘蔷 苏斐 杨中国 王显灿 
为方便研究自然语言处理的学者选择更有效的实验语料,进行自然语言处理类科技文献的实验语料抽取研究。实验语料是指自然语言处理类文献在实验过程中使用的文本类数据,如训练数据、测试数据等。将文本划分为实验语料句和非实验语料句两...
关键词:信息抽取 科技文献 特征提取 机器学习 朴素贝叶斯模型 
基于数据集特征的KNN最优K值预测方法被引量:14
《计算机应用与软件》2016年第6期54-58,83,共6页李洪奇 杨中国 朱丽萍 刘蔷 
中国石油大学(北京)基金项目(KYJJ2012-05-25)
KNN算法中的参数K的选择一般采取多次交叉验证方法求取,数据规模较大时并不适用。同时,影响参数选择最根本的因素是数据集本身。因此,提出利用数据集本身的特征预测最优K值的方法。首先提取历史数据集的简单特征、统计特征、信息熵特征...
关键词:KNN分类算法 数据集特征 信息熵 最优K 
一种面向科技文献引言的信息抽取方法被引量:6
《山东大学学报(理学版)》2015年第7期23-30,37,共9页朱丽萍 李洪奇 杨中国 刘蔷 
中国石油大学(北京)基金资助项目(KYJJ2012-05-25);国家重大科技专项(2011ZX05023-005-06;2011ZX05020-007-007)
分析了引言部分写作模型,将文本按照句子级别划分为背景知识、问题分析、工作描述三个类别。统计每个部分句子的引导词、句型表达、线索词、所处位置的特征,并构建相应规则库。在分词和词性标注基础上,利用规则匹配每个句子得出所属的类...
关键词:科技文献 信息抽取 背景知识 线索词 
基于语义模式和引用分布的科技文献信息抽取被引量:3
《山东大学学报(理学版)》2015年第3期11-19,共9页杨中国 李洪奇 朱丽萍 刘蔷 
中国石油大学(北京)基金资助项目(KYJJ2012-05-25);国家重大科技专项(2011ZX05023-005-006;2011ZX0520-007-007)
科技文献中回顾前人研究成果、分析存在的问题、提出解决方法等语言片段是论文创新性信息的构成部分。分析论文写作过程中问题分析信息的逻辑思维以及在文章中呈现的篇章关系,综合利用引用分布特征、篇章关系特征、否定情感特征构建具...
关键词:引用分布 篇章关系 语义模式 否定情感 引导词 
检索报告 对象比较 聚类工具 使用帮助 返回顶部