基于规则的网页分割预处理算法研究  被引量:1

Rule-based Preprocessing Algorithm for Web Page Segmentation

在线阅读下载全文

作  者:彭红超[1] 童名文[1] 邹军华[2] 郝秋红[1] 

机构地区:[1]华中师范大学信息与新闻传播学院,武汉430079 [2]湖北大学教育学院,武汉430070

出  处:《计算机科学》2013年第11A期379-382,388,共5页Computer Science

基  金:教育部人文社科基金项目:移动学习服务适配决策技术及优化策略研究(10YJC880113);国家科技支撑计划课题:全媒体在线编辑与适配推送数字出版技术研究及应用示范(2013BAH30F01);中央高校基本科研业务费项目:泛在多媒体服务中内容适配决策模型及优化研究;中央高校基本科研业务费项目:数字化学习环境及工具的典型应用(CCNU10C01003)资助

摘  要:针对国家精品课程网站中网页内容和样式独立设计,网页分割算法难以运行的问题,基于规则提出了一种网页分割预处理算法,建立了网页标签和样式信息的关联。算法包括3个步骤:第一,获取样式信息;第二,关联样式信息和标签;第三,输出HTML和PerfectNode关联类列表。随机选取了100个国家精品课程网站的网页运行预处理算法,实验结果表明该算法可以有效地融合网页标签和样式信息,解决了网页分割算法无法运行的问题。Since the independent design between web contents and styles of National Level Excellent Courses,web page segmentation algorithm can hardly run. We present a rule-based preprocessing algorithm of web page segmentation to create correlation between tags and style information. The algorithm consists of three steps:first,get the style information; second, associate styles with tags;third, output HTML and PerfectNode which is associated class list. We selected 100 pages from the National Level Excellent Courses randomly to run the preprocessing algorithm. Experimental results show that the algorithm can associate tags with styles efficiently, which can solve the problems that web page segmentation algorithm cannot run.

关 键 词:网页分割 预处理算法 级联样式表 样式信息 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象