一种面向网店商品搜索的中文分词系统设计  被引量:1

A design of Chinese word segmentation system for searching electronic store product

在线阅读下载全文

作  者:王敏[1] 叶宽余[2] 薛峰[2] 

机构地区:[1]安徽工商职业学院工商管理系,安徽合肥230041 [2]合肥工业大学计算机与信息学院,安徽合肥230009

出  处:《合肥工业大学学报(自然科学版)》2012年第6期772-775,813,共5页Journal of Hefei University of Technology:Natural Science

基  金:安徽省自然科学基金资助项目(090412059);安徽省高等学校省级质量工程资助项目(20101726;20101720)

摘  要:文章设计新的数据结构对网店商品的原始数据进行加工处理,形成一个存储所有商品信息的词条字典。结合全切分算法,实现对用户输入关键词的完全切分,并通过和词条字典的匹配得到所有候选的词条组合。为了消除分词过程中的歧义和不合理的词条组合,系统结合商品类目树的存储结构,通过算法和引入权值计算的方法对词条组合进行排序,得到最佳结果。This paper designs a new data structure to process the original data of the electronic store product in order to form a word dictionary of restoring all of the product information. The system uses the complete segmentation algorithm to segment user-input keywords, and matches them with the words dictionary to obtain the selected words combination. To exclude the result ambiguity and the il- logical word combination, and by applying the storage structure of the directory tree, the system de- signs three filtering algorithm and leads in weight calculation to sort words combination so as to ac- quire the best search result.

关 键 词:中文分词 全切分 商品搜索 

分 类 号:TP311.11[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象