检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]盐城工学院信息工程学院,江苏盐城224003 [2]江苏大学计算机科学与通信学院,江苏镇江212013
出 处:《计算机工程与应用》2011年第11期94-97,共4页Computer Engineering and Applications
摘 要:为了对用户访问过并感兴趣的网页进行准确描述,分析了对网页特征描述中涉及到的特征抽取范围以及特征词权重计算方法。根据"主题相关词非线性加权的方法"提出了一种改进特征词权重计算的方法,该方法不仅考虑了出现在标题中的特征词的重要性,而且利用非线性函数对特征词出现频率的处理思想,使得权重的计算更加准确。使用改进的特征权重计算方法提高了网页特征描述的准确性,从而提高了用户个性化搜索的效率。In order to accurately describe the Web pages that users have visited and been interested in,it analyzes the scope of characteristic extraction and the method used to compute the weight of characteristic words in the page characteristic description.According to"A nonlinear weighted method of handling related topic words",an improved method based on the weight of characteristic words is raised.In this new method,it considers the importance of characteristic words in the title, and gives an idea using nonlinear-function to process the frequency of characteristic words,which will make the weight calculation more precise and will increase the accuracy of the page characteristic description.As a result,the efficiency of the user’s personalized searching can be enhanced.
关 键 词:个性化搜索 网页特征 权重计算 特征词 非线性函数
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.112.77