文本分块

作品数:8被引量:67H指数:3
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:陈治平刘云中周新民吴芬芬刘磊更多>>
相关机构:湖南大学燕山大学吉林大学福建工程学院更多>>
相关期刊:《河南科技大学学报(自然科学版)》《吉林大学学报(理学版)》《中南林业科技大学学报》《系统仿真学报》更多>>
相关基金:国家自然科学基金教育部科学技术研究重点项目吉林省科技发展计划基金河北省自然科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-8
视图:
排序:
基于三阶条件随机场的论文元数据提取方法被引量:1
《小型微型计算机系统》2014年第3期606-609,共4页于洪涛 虞海明 张付志 
河北省自然科学基金项目(F2011203219;F2013203124)资助;教育部科技发展中心网络时代的科技论文快速共享专项研究课题(2011109)资助;河北省高等学校科学技术研究重点项目(ZH2012028)资助
针对现有论文元数据提取方法精度不高和上下文信息利用较少的问题,通过对二阶条件随机场模型的状态转移特征进行扩展,提出了一种基于三阶条件随机场的论文元数据提取方法.首先,利用分隔符对论文头部文本进行分块预处理,选择局部、布局...
关键词:元数据提取 条件随机场 三阶 文本分块 平滑处理 
中文文本数字水印算法的研究被引量:2
《中南林业科技大学学报》2011年第8期204-210,共7页何岸 胡伟刚 
2010年度湖南省高等学校科学研究项目(10C1313)
为了提高水印的鲁棒性,适应文本完整性检测的需求,很多文献提倡多组水印的冗余嵌入方法,这涉及到文本分块问题。根据中文汉字的结构,研究并提出了一种中文文本分块设计方法以及水印嵌入算法。该方法具有明显的中文文字特色,能有效提高...
关键词:文本分块 汉字结构 鲁棒性 
一种基于启发式搜索的论文元数据提取算法被引量:1
《计算机应用与软件》2009年第9期86-88,94,共4页张付志 侯娜 刘慧 马玉静 
河北省自然科学基金项目(F2008000877)
随着大量的科研论文以电子文档的形式出现,为了高效地检索这些科研文献资料,从中精确地抽取这些论文头部的元数据信息显得十分有必要。在条件随机场模型的基础上,提出了一种启发式搜索算法来对论文头部的元数据信息进行提取。该算法首...
关键词:信息提取 元数据提取 条件随机场 文本分块 启发式搜索 
基于特征和隐马尔可夫模型的文本信息抽取被引量:3
《河南科技大学学报(自然科学版)》2008年第2期55-57,70,共4页常军林 吴笑伟 吴芬芬 刘磊 
吉林省科技发展计划项目(20050527)
基于文本分块提出一种新的文本信息抽取技术,该技术利用文本的语义特征和结构特征,抽取具有特征的状态,以此结果为基础,进一步运用改进的隐马尔可夫模型,抽取剩余的无特征状态。对美国CMU大学CORA搜索引擎研制组提供的数据集中的100篇...
关键词:文本分块 特征提取 隐马尔可夫模型 
一种启发式的信息抽取算法被引量:3
《吉林大学学报(理学版)》2007年第1期73-76,共4页吴芬芬 刘磊 肖宪 
吉林省科技发展计划项目基金(批准号:20050527)
提出一种启发式的信息抽取算法,并利用该算法建立一个信息抽取系统.该系统基于文本分块,利用文本的语义特征和结构特征,抽取具有特征的状态,在此基础上,利用反向动态规划和正向A*算法,抽取剩余的无特征状态.通过对100篇论文头部进行测...
关键词:启发式算法 文本分块 A^*算法 
基于汉字结构知识的鲁棒性公开文本水印被引量:4
《计算机工程与应用》2006年第8期165-167,169,共4页周新民 孙星明 刘超 
国家自然科学基金资助项目(编号:60373062);教育部科研重点项目(编号:03092);湖南省杰出中青年基金资助项目(编号:02JJYB012)
针对中文文本存在的版权保护问题,文章提出了一种新的文本水印算法。该方法通过汉字数学表达式,获取汉字的结构类型和笔画数,利用汉字的结构类型将整个文档分成两块,在各块中由汉字笔画数和水印比特位共同确定水印加载的位置,通过设置...
关键词:文本水印 汉字结构知识 海明校验 文本分块 版权保护 
基于文本分块的多模板隐马尔可夫模型的文本信息抽取被引量:4
《山东大学学报(理学版)》2006年第3期25-28,共4页王雷 陈治平 李志成 
福建省青年科技人才创新资助项目(2005J051);福建省自然科学基金资助项目(A0510024);广东省关键领域重点突破资助项目(2005A10207003)
针对文本信息抽取中训练数据来源的多样化,不利于学习到最优的模型参数的问题,提出了一种基于多模板隐马尔可夫模型的文本信息抽取算法.新算法利用文本排版格式、分隔符等信息,对文本进行分块,在此基础上,通过对训练数据分成多个形式模...
关键词:文本信息抽取 隐马尔可夫模型 多模板 文本分块 
基于隐马尔可夫模型的文本信息抽取被引量:52
《系统仿真学报》2004年第3期507-510,共4页刘云中 林亚平 陈治平 
国家自然科学基金(60272051)
文本信息抽取是处理海量文本的重要手段,将隐马尔可夫模型应用到信息抽取领域是一个比较新的研究课题。提出了一种基于隐马尔可夫模型的文本信息抽取算法。该算法利用文本排版格式、分隔符等信息,对文本进行分块,在分块的基础上结合隐...
关键词:隐马尔可夫模型 信息抽取 文本分块 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部