检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江中烟工业有限责任公司,浙江杭州310009
出 处:《信息技术与信息化》2015年第8期158-160,共3页Information Technology and Informatization
摘 要:企业知识库数据量以爆炸性的速度增长,其中大部分信息是非结构化的文本数据,系统往往不能快速准确地满足企业用户的查询请求。为解决这一问题,提出了一种基于TFIDF算法同义替换和相邻合并的文本挖掘技术。这种技术可以降低服务器压力,使服务人员可以更快更准确的从知识库中寻找出相关信息。最后以实例验证了本算法的有效性。Enterprise knowledge repository increases with the explosive growth rate, most of which is unstructured text data.The application often can not meet the user's query requests quickly and accurately. To solve this problem, a novel text mining technique based on TFIDF with synonymous substitutions and adjacent integrationis proposed, which can reduce the server stress and make it more efficient to extract expected information. Finally, examples demonstrate the effectiveness of the algorithm.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.239