检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王洪浩 WANG Hong-hao(Shandong Zheyuan Information Technology Co,Ltd.,Dongying 257200,China)
机构地区:[1]山东哲远信息科技有限公司,山东东营257200
出 处:《中小企业管理与科技》2019年第3期103-104,共2页Management & Technology of SME
摘 要:在对汉字信息进行处理的过程中,汉字词汇本身的构成具备一定的特殊性,无法实现像英文一样根据空格来分隔单词。因此,对于一整段汉字进行切分形成独立词语是中文信息处理上难点所在。论文主要对中文分词算法以及相应的中文分词技术进行分析和研究,帮助更多人了解到中文分词算法在搜索引擎中的应用。In the process of processing Chinese characters'information,the formation of Chinese character vocabulary itself has certain particularity,so it is difficult to separate words according to spaces as in English.Therefore,the fragmentation of a whole Chinese character into independent words is the difficulty of Chinese information processing.The paper mainly analyzes and studies the Chinese word segmentation algorithm and the corresponding Chinese word segmentation technology,so as to help more people understand the application of Chinese word segmentation algorithm in search engine.
分 类 号:U44[建筑科学—桥梁与隧道工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.200