Web文本分类中的反作弊研究  

在线阅读下载全文

作  者:付敬鼎[1] 张建勇[1] 贾晓强[1] 

机构地区:[1]渭南师范学院数学与信息科学学院

出  处:《网友世界》2013年第18期7-7,共1页Net Friends

基  金:渭南师范学院大学生创新基金项目(项目编号:12XK050)

摘  要:根据用户定义的某一主题,在爬虫算法中加入反作弊思想后,用爬虫算法遍历网络,收集与主题相关的页面进行智能分析,同时将文本过滤转化为文本分类,为了增强通用性,在算法中加入了松弛变量,最后在NB分类个器上验证算法的性能。试验表明,分类精度达到将近90%。

关 键 词:主题爬虫 文本分类 反作弊 松弛变量 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象