文本块

作品数:29被引量:48H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:刘国华麻会东刘鹏程高嵩肖柏华更多>>
相关机构:北京百度网讯科技有限公司阿里巴巴集团控股有限公司深圳市腾讯计算机系统有限公司信息技术有限公司更多>>
相关期刊:《电脑爱好者》《网友世界》《计算机应用研究》《广西师范大学学报(自然科学版)》更多>>
相关基金:国家自然科学基金长江学者和创新团队发展计划教育部科学技术研究重点项目国家留学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于标签路径覆盖率和多文本特征的正文抽取算法
《大连交通大学学报》2019年第5期112-116,共5页郑野 宋旭东 于林林 陈鑫影 
辽宁省自然科学基金资助项目(1553735707452,20170540144)
如何正确识别网页中存在的网页评论、导航、版权声明等噪音数据,提高网页抽取正文的准确度,提出了一种结合多种文本特征的正文抽取算法(CETD-TPF).在文本块密度和标签路径覆盖率的基础之上又融合了文本符号特征,利用新特征确定并抽取正...
关键词:文本块密度 标签路径覆盖率 正文抽取 
篇章级并列关系文本块识别方法研究被引量:1
《数据分析与知识发现》2019年第5期51-56,共6页裴晶晶 乐小虬 
【目的】识别出科技论文中分布在不同段落、在语义及版面视觉上具有并列关系的文本块,捕捉并列关系文本特征,为并列关系知识对象识别提供预训练模型。【方法】以段落为处理单元,在字符向量和词向量的基础上附加版面视觉特征,对不同层级...
关键词:并列关系 文本表示 文本块 深度学习 
基于文本块密度和标签路径覆盖率的网页正文抽取被引量:5
《计算机应用研究》2018年第6期1645-1650,共6页刘鹏程 胡骏 吴共庆 
国家重点研发计划资助项目(2016YFB1000901);国家自然科学基金资助项目(61273297;61229301;61673152);国家教育部创新团队发展计划资助项目(IRT13059);国家留学基金资助项目(201506695019)
大多数网页除了正文信息外,还包括导航、广告和免责声明等噪声信息。为了提高网页正文抽取的准确性,提出了一种基于文本块密度和标签路径覆盖率的抽取方法(CETD-TPC)。结合网页文本块密度特征和标签路径特征的优点,设计了融合两种特征...
关键词:正文抽取 文本块密度 标签路径覆盖率 特征融合 
基于文本块密度与标签路径等特征的正文提取被引量:1
《广东工业大学学报》2018年第2期51-56,共6页杨贤 唐超兰 李航 
广东省部产学研专项资金企业创新平台资助项目(2013B090800042)
为了解决网页中除正文信息外还包含网页导航、广告和免责声明等噪声信息的问题,本文提出一种基于标签路径等多特征和文本块密度的正文提取方法.首先根据文本块密度特征确定正文区域,然后在区域内使用标签路径等特征剔去噪音节点,最后抽...
关键词:正文抽取 文本块 标签路径 文本密度 
基于块密度加权标签路径特征的Web新闻在线抽取被引量:3
《中国科学:信息科学》2017年第8期1078-1094,共17页吴共庆 刘鹏程 胡骏 胡学钢 
国家重点研发计划(批准号:2016YFB1000901);教育部创新团队发展计划(批准号:IRT13059);国家自然科学基金(批准号:612-73297;61673152);国家留学基金(批准号:201506695019)资助项目
Web新闻内容抽取是众多"大数据"和"大知识"应用的基础,也是一个开放性问题.标签路径特征和文本块密度特征是目前解决该问题的两类优良特征.标签路径特征能较好地区分全网页的内容与噪声,但难以识别内容块中的噪声和噪声块中的内容;文本...
关键词:内容抽取 WEB新闻 文本块密度 标签路径特征 在线算法 
文档抄袭检测研究
《消费电子》2013年第4期34-35,共2页张超 侯青青 陶宏敏 李俊杰 邹威 
针对作业抄袭现象,建议教师使用作业抄袭检测系统,分析了各种文档抄袭检测系统和文档特征提取方式,研究并提出了基于句子相似度语句定位的作业抄袭检测。
关键词:文档抄袭 特征提取 文本块 
VC插入汉字文本块的编程方法
《长江大学学报(自科版)(上旬)》2012年第12期102-104,共3页邹雪峰 张翔 刘琳琳 
一般的绘图软件如Surfer、Graph等只支持英文和数字的文本输出,给图形资料解释说明带来不方便。采用VC编程实现了对汉字文本块输出,并设计了相应的独立文本类CText,对汉字双字节作了校正处理,杜绝了断字和乱码的出现。同时,该类实现了...
关键词:文本框 文本块 矢量绘图 字符串绘制 鼠标交互 
如何纵向选择文本块
《电脑爱好者》2012年第18期42-42,共1页
在Word中用通常的方法所选中的内容都是连续的文本,例如一个句子、一行或一段。如果遇到需要选择一组数据中的一列或一个方阵名单中的一列人名,需要我们以矩形块状来选择,那么在文档中能否实现选择纵向文本呢?我给大家介绍两种方法。
关键词:文本块 鼠标左键 Word ALT键 ESC键 组合键 方向键 拖动 
快速找出文档修改前后的不同
《电脑爱好者》2010年第14期75-75,共1页
我使用TextDiff(下载地址:http://www.onlinedown.net/soft/32899.htm),运行后,直接将文件拖曳到TextDiff窗口中,按F9就能比较。默认情况下黑色字符表示相同的行。绿色加亮表示不同的行,红色加亮表示删除的行,蓝色加亮表示...
关键词:修改 文档 SOFT .NET HTTP 下载地址 快速切换 文本块 
基于文字混合特征的视频文本定位研究
《微计算机信息》2009年第18期161-162,176,共3页赵超 方向忠 
针对视频中文本信息在视频序列和视频索引中的重要性,本文提出了一种基于文字混合特征的文本定位算法。该算法首先对视频序列中每隔25帧的单帧图像进行边缘检测和投影处理来提取文本块,然后用支持向量基进行筛选,排除非文本块的干扰,最...
关键词:文本块 支持向量基 视频序列 
检索报告 对象比较 聚类工具 使用帮助 返回顶部