统计分词

作品数:9被引量:46H指数:4
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:杨森柴乔林徐海涛王荔黄科更多>>
相关机构:中南大学西安电子科技大学山东大学北京吉威时代软件股份有限公司更多>>
相关期刊:《中文信息学报》《计算机产品与流通》《物联网技术》《计算机工程与应用》更多>>
相关基金:国家重点基础研究发展计划湖南省自然科学基金国家自然科学基金国家社会科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-9
视图:
排序:
NLP视角下患者转运产品用户满意度分析
《计算机产品与流通》2024年第2期30-32,共3页顾松松 
宁波职业技术学院校级青年课题“基于NLP的患者转运产品的情感分析研究”(项目编号:NZ24056Q)。
推广老年人的康复辅助护理床的使用可以在一定程度上推动我国“健康老龄化”事业的发展。本文研究受众对于上述产品的使用感受以及态度。利用网络爬虫可以方便地获取网页评论内容,这些采集的内容可以作为文本挖掘的源头。使用Jieba、Wor...
关键词:网络爬虫 文本挖掘 统计分词 Word 情感倾向 主题挖掘 健康老龄化 用户满意度 
中文病历文本分词方法研究被引量:8
《中国生物医学工程学报》2016年第4期477-481,共5页李国垒 陈先来 夏冬 杨荣 
国家社会科学基金(13BTQ052)
探索适合医学文本的分词方法,为医学数据挖掘和临床决策支持的语义分析奠定基础。分别使用单纯中科院ICTCLAS分词、ICTCLAS+自定义词典、ICTCLAS+统计分词和ICTCLAS+自定义词典结合互信息统计分词4种策略,对1 500份出院记录中的病历文...
关键词:病历文本 中文分词 统计分词 词典分词 出院记录 
中文分词算法研究与分析被引量:9
《物联网技术》2016年第1期87-89,共3页江华丽 
中文分词作为搜索引擎以及自然语言处理的重要组成部分,是当前这一领域的研究热点和难点之一。文中首先分析了中文分词的特点,包含基于字符串匹配分词算法、基于统计分词算法、基于理解分词算法这三大类的各种中文分词算法。并通过分析...
关键词:中文分词 字符串匹配分词 统计分词 理解分词 
基于统计方法的Web新词分词方法研究被引量:2
《计算机工程与科学》2010年第5期133-135,共3页张敏 王春红 
山西省高等学校科技开发项目(20091150);运城学院项目(JC-2009009)
本文对信息处理技术中各种分词方法进行了研究,针对目前分词方法无法识别网络中不断出现的新词,设计了一种新的基于统计的分词方法。该方法避开现有的分词方法中的复杂语法规则,无需词典的支持,很好地解决了新词不断出现的问题,而且分...
关键词:WEB 统计分词 词典 特征提取 
一种全切分与统计结合的分词系统被引量:1
《微电子学与计算机》2009年第5期68-70,共3页王荔 宋胜利 冯佳 陈平 
国防"十一五"预研项目(513060601)
歧义消解是中文分词的主要问题之一.提出了一种全切分与统计结合的分词算法,构造出基于统计词典的有向无环词图,利用动态规划算法得出最佳的分词路径.实验证明,系统有效地提高了歧义切分的准确性及分词速度.
关键词:中文分词 全切分 统计分词 歧义消解 
基于Hash结构的机械统计分词系统研究被引量:8
《计算机工程与应用》2006年第5期159-161,共3页费洪晓 胡海苗 巩燕玲 
国家自然科学基金资助项目(编号:60173041);湖南省自然科学基金资助项目(编号:02JJY2094)
在综合比较了常用的机械分词方法和统计分词方法基础上,论文设计并实现了一种基于Hash结构的机械统计分词系统。系统突破了传统的机械分词方法和统计分词方法,结合了两者的优势,并对其做了一系列的改进。从对测试结果的分析可以看出,系...
关键词:中文分词 机械分词 统计分词 Hash结构 
基于统计分词的中文文本分类系统被引量:1
《电脑知识与技术》2005年第4期71-74,共4页D吴雅娟 柳培林 丁子睿 
本文阐述了一个中文文本分类系统的设计和实现,对文本分类系统的系统结构、特征提取、训练算法、分类算法等进行了详细介绍,将基于统计的二元分词方法应用于中文文本分类,并提出了一种基于汉语中单字词及二字词统计特性的中文文本分类方...
关键词:分类系统 分词 中文文本分类 系统结构 特征提取 训练算法 详细介绍 分类算法 方法应用 分类方法 统计特性 词表 
基于统计分词的中文邮件智能分类系统被引量:1
《华中科技大学学报(自然科学版)》2003年第S1期325-328,共4页徐海涛 杨森 柴乔林 
区别于以往采取专家系统、基于语义分析及基于关键字比较的分类方法 ,根据文本数据学习的特点 ,采用支持向量机 (SVM )来实现电子邮件的智能分类方法 .通过SVM方法与其他几种分类方法试验测试 ,结果发现 ,SVM方法效果最好 。
关键词:电子邮件 分类 支持向量机 召回率 
基于统计分词的中文网页分类被引量:16
《中文信息学报》2002年第6期25-31,共7页黄科 马少平 
国家重点基础研究 973(G19980 30 5 0 9) ;86 3高技术项目 (2 0 0 1AA114 0 82 )
本文将基于统计的二元分词方法应用于中文网页分类 ,实现了在事先没有词表的情况下通过统计构造二字词词表 ,从而根据网页中的文本进行分词 ,进而进行网页的分类。因特网上不同类型和来源的文本内容用词风格和类型存在相当的差别 ,新词...
关键词:中文网页分类 文本分类 统计分词 机器学习 计算机网络 汉字识别 
检索报告 对象比较 聚类工具 使用帮助 返回顶部