检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]福州大学数学与计算机科学学院,福建福州350002
出 处:《福州大学学报(自然科学版)》2004年第z1期67-71,共5页Journal of Fuzhou University(Natural Science Edition)
基 金:福建省自然科学基金资助项目(A0110009);福州大学科技发展基金资助项目(2002-XQ-21)
摘 要:针对Web文本挖掘中的中文信息处理的问题,介绍了将超文本格式(Html格式)的文档转化为纯文本格式(Txt格式)文档的方法.利用改进的最大匹配法来实现对文档的汉语自动分词,同时,加强消除歧义方面的处理,分词精度有所提高.Introduced a method to convert html form text to txt form text, and improved the most match method to realize the Chinese automatic word-segment in text. In addition, paid great attention to dispelling ambiguity, and the accuracy improved to some extent.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.158