半结构化信息

作品数:23被引量:91H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:黄豫清张福炎张正强钱龙华惠浩添更多>>
相关机构:南京大学中国科学技术大学清华大学苏州大学更多>>
相关期刊:《软件导刊》《自动化技术与应用》《计算机工程与设计》《湘潭大学学报(哲学社会科学版)》更多>>
相关基金:江苏省高校自然科学研究项目国家自然科学基金中国人民解放军总装备部预研基金湖北省教育厅科学技术研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
科创项目信息提取系统设计
《现代信息科技》2024年第7期19-24,共6页柏斌 
文章分析讨论了半结构化信息管理技术的发展状况和应用情况,在梳理和总结半结构化文本信息抽取载体类型、内容和技术方法的基础上,设计了科创项目信息提取系统。该系统数据源以科研院所/创业团队提供的商业策划书为主,采用B/S架构,以基...
关键词:半结构化信息 科创项目 信息提取系统 
中文维基百科的实体分类研究被引量:1
《中文信息学报》2015年第5期91-97,124,共8页徐志浩 惠浩添 钱龙华 朱巧明 
国家自然科学基金(61373096;90920004);江苏省高校自然科学研究重大项目(11KJA520003)
维基百科实体分类对自然语言处理和机器学习具有重要的作用。该文采用机器学习的方法对中文维基百科的条目进行实体分类,在利用维基百科页面中半结构化信息和无结构化文本作为基本特征的基础上,结合中文的特点使用扩展特征和语义特征来...
关键词:维基百科 实体分类 半结构化信息 信息框 
基于自监督学习的维基百科家庭关系抽取被引量:1
《计算机应用》2015年第4期1013-1016,1020,共5页朱苏阳 惠浩添 钱龙华 张民 
国家自然科学基金资助项目(61373096;90920004);江苏省高校自然科学研究重大项目(11KJA520003)
传统有监督的关系抽取方法需要大量人工标注的训练语料,而半监督方法则召回率较低,对此提出了一种基于自监督学习来抽取人物家庭关系的方法。该方法首先将中文维基百科的半结构化信息——家庭关系三元组映射到自由文本中,从而自动生成...
关键词:自监督学习 维基百科 半结构化信息 关系抽取 
国家标准《文件管理元数据原则》中文件管理元数据的结构化信息与半结构化信息的理解被引量:3
《档案学研究》2011年第6期31-36,共6页张正强 
论文对国家标准《文件管理元数据原则》中文件管理元数据的结构化信息与半结构化信息的定义、由来及其如何理解进行了探讨,并对作为典型的结构化信息的《都柏林核心元数据集》进行了辨析,同时,对文件管理元数据的半结构化信息进行了辨析...
关键词:文件管理元数据 结构化信息 半结构化信息 
论文件管理元数据的结构化信息与半结构化信息被引量:1
《上海档案》2011年第8期3-7,共5页张正强 
文件管理元数据的结构化信息与半结构化信息,在2011年最新发布的国家标准《GB/T26163.1-2010信息与文献-文件管理过程-文件元数据-第1部分:原则》(以下简称国家标准《文件元数据原则》)中有专门的阐述。那么,什么是文件管理元数据的...
关键词:半结构化信息 管理元数据 文件 国家标准 管理过程 文献 
电子邮件归档,保护数字资产
《网管员世界》2010年第3期119-120,共2页Openfind Herman 
根据Forrest Research的调查统计数据显示,企业的无形资产中有2喊左右的信息,有效地储存在各种类型的结构化数据库中;但是还有80%的非结构化或半结构化信息(文件档案、电子邮件、多媒体等),分散于组织间与个人计算机中,而其中...
关键词:电子邮件 数字资产 半结构化信息 归档 保护 结构化数据库 个人计算机 数据显示 
网络媒体高考报道的信息结构分析
《新闻研究导刊》2010年第4期24-26,共3页罗昕 
一、Web2.0时代的网络信息结构 互联网上出现的海量信息,其结构要素有三大部分组成,即结构化信息、半结构化信息和非结构化信息。结构化信息主要指通常接触的数据库所管理的信息,信息的性质和量值的出现位置是固定的、有序的,结...
关键词:信息结构 网络媒体 高考报道 半结构化信息 Web2.0 海量信息 结构要素 基础要素 
基于启发式规则的多记录页面分隔符识别方法被引量:1
《软件导刊》2009年第9期50-51,共2页胡大洋 
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符,如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,能够很好...
关键词:信息提取 半结构化信息 非结构化信息 记录边界 记录分隔符 
一种发现多记录Web文档记录分隔符的方法
《计算机与信息技术》2008年第8期10-12,共3页胡大洋 陈金鑫 
从半结构化或者非结构化的Web文档中提取信息时通常要求指定记录集的边界符。如果不根据记录边界符将包含多记录的页面分成单个记录块,那么记录的提取就不能成功。本文主要介绍了一种根据启发式的规则发现Web文档中的记录分隔符的方法,...
关键词:信息提取 半结构化信息 非结构化信息 记录边界 记录分隔符 
基于Web Services的Web挖掘实现方案被引量:1
《自动化技术与应用》2008年第5期73-75,79,共4页李艳霞 巩九洲 黎玉琴 
甘肃省科技攻关计划项目(2GS047-A52-002-04)
随着信息技术的发展,Web挖掘技术已成为数据挖掘技术的研究热点。本文针对Web挖掘中数据库环境的异构和信息半结构化等难题,提出了一个Web services框架下的Web挖掘实现方案,使用XML关键技术对异构信息进行包装,使之成为统一的数据模式...
关键词:WEB挖掘 Web SERVICES XML 包装器 半结构化信息 
检索报告 对象比较 聚类工具 使用帮助 返回顶部