中文文本挖掘

作品数:15被引量:131H指数:6
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:胥桂仙高旭杨丹丹张国煊谌志群更多>>
相关机构:华北电网有限公司中央民族大学大连理工大学杭州电子科技大学更多>>
相关期刊:《情报科学》《哈尔滨工程大学学报》《黑龙江高教研究》《兰州理工大学学报》更多>>
相关基金:国家自然科学基金浙江省自然科学基金国家教育部博士点基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
中文文本挖掘的流程与工具分析被引量:2
《科技创新导报》2019年第19期142-142,144,共2页李果 
文本挖掘技术在各行业的应用价值高、范围广,中文文本跟西方语言相比本身具有很大的特点,因此本文的研究内容是针对于中文文本展开的。首先对文本挖掘的基本含义和状况做了简要概述,对于中文文本挖掘的概念和流程做了详细介绍,对于其中...
关键词:中文 文本挖掘 流程 工具 
中文文本挖掘的动态文摘建模方法被引量:1
《哈尔滨工程大学学报》2019年第4期820-826,共7页刘美玲 王慧强 陈广胜 于洋 
国家自然科学基金项目(61702091);中央高校基本科研业务费专项资金项目(2572018BH06)
中文文摘是自然语言处理领域的重要研究之一,尤其是基于理解的文摘中对时间特征的研究,更是引起了广泛的关注。本文抽取中文文本摘要的动态特征,进行文本挖掘和建模分析来体现时间特性。通过对中文动态多文档文摘系统框架和句子加权、...
关键词:动态文摘 建模 文本挖掘 中文摘要 评测方法 句子加权 文本理解 语料测试 
基于CRTP模型的极端消极评论的内容价值研究
《贵州大学学报(自然科学版)》2019年第1期71-75,共5页佘玉萍 车艳 
福建省教育厅项目资助(JAT170505);福建省教育厅中青年教师教育科研项目资助(JAT170504);福建省莆田市科技局项目资助(2018GP2006);莆田市科技计划科研创新专项项目资助(2018ZP10)
以获取有助于改进电子商务中商品质量的评论为直接目标,研究用户评论的内容价值。主要面向用户极端消极评论,从评论内容的极端消极评论的筛选、文本词条化、词条之间的紧密联系等方面来探讨评论文本的价值,采用多层次的文本内容分析技...
关键词:极端消极评论 中文文本挖掘 CRTP模型 内容分析 
“双一流”建设背景下中国高校的战略选择和行动路径被引量:8
《黑龙江高教研究》2018年第8期1-5,共5页王冬 朱宁洁 
高校的思想认同和具体实践是国家实施"双一流"战略取得成效的关键,五年规划能清晰地展现高校未来的战略选择和行动路径。文章采用NLPIR汉语分词系统对72所部属高校"十三五"规划进行文本挖掘,发现新时期高校对发展基础与环境持乐观态度,...
关键词:“双一流”建设 中国高校 “十三五”规划 中文文本挖掘 
基于R语言的网络舆情对股市影响研究被引量:7
《兰州理工大学学报》2018年第4期103-108,共6页朱昶胜 孙欣 冯文芳 
兰州理工大学红柳杰出人才基金项目(J201304)的资助
以开源R语言为平台,东方财富网的股评为研究对象,结合中文文本挖掘技术和SVR支持向量回归模型.利用中文挖掘技术,对股评进行去噪声、分词、同义词合并、去停用词、TFIDF、文本向量化将非结构化文本数据转化为结构化的特征向量矩阵,与股...
关键词:网络舆情 R语言 中文文本挖掘 SVR模型 
基于中文文本挖掘的安全预警系统的探索与实现
《电脑迷》2018年第1期211-212,共2页黄思行 丁楠 蔡腊梅 Chen Shuang 
随着社会的发展和互联网的普及,人们的各种压力日益增大,越来越喜欢在各种网络平台上表达自己的心情,那么跟踪其关键词汇并对其进行分析,可以迅速检测并预防潜在的安全隐患。为此,本文研究了一个基于中文文本挖掘的安全预警系统。该系...
关键词:文本挖掘 中文分词 词语聚类 文本评分 程度划分 安全预警 
统计模型在中文文本挖掘中的应用被引量:15
《数理统计与管理》2017年第4期609-619,共11页王健 张俊妮 
本文讨论了中文文本挖掘的三个问题:分词、关键词提取和文本分类。对分词问题,介绍了基于层叠隐马尔可夫模型的ICTCLAS分词法,以及将词与词之间的分隔视为缺失数据并用EM算法求解的WDM方法;对关键词提取问题,提出了贝叶斯因子法,并介绍...
关键词:中文分词 关键词提取 文本分类 贝叶斯因子 L1范数惩罚 主题模型 
文本挖掘与中文文本挖掘模型研究被引量:51
《情报科学》2007年第7期1046-1051,共6页谌志群 张国煊 
浙江省自然科学基金项目(M603025)
文本挖掘,又称为文本数据挖掘或文本知识发现,是指在大规模的文本中发现隐含的、以前未知的、潜在有用的模式的过程。本文首先对文本挖掘进行了概述,给出了文本挖掘的定义、特点和研究现状。然后对国内中文文本挖掘的研究现状进行了分析...
关键词:文本挖掘 数据挖掘 中文文本挖掘模型 中文信息处理 
TGFCM:基于模糊聚类的中文文本挖掘的新方法
《计算机工程》2006年第5期7-9,共3页耿新青 王正欧 
国家自然科学基金资助项目(60275020)
提出一种新的动态模糊聚类的方法,针对传统的模糊聚类需要预先确定聚类数的问题,提出采用动态自组织映射神经网络来确定聚类数,并通过文本向量空间模型和TF?IDF方法来确定文本的特征向量,再将动态自组织映射神经网络得到的聚类数,用模糊...
关键词:自组织映射网络 文本特征向量 模糊聚类 聚类数 
关联规则算法在中文文本挖掘中的应用研究被引量:5
《中央民族大学学报(自然科学版)》2004年第4期332-338,共7页胥桂仙 高旭 于绍娜 
 本文介绍了关联规则的主要概念及关联规则的经典算法,并将关联规则算法应用于中文文本挖掘中,目的是通过计算文本特征词间的支持度、可信度关系了解文本间的关联关系.
关键词:中文文本 关联规则算法 支持度 可信度 挖掘 关联关系 文本特征 概念 经典 目的 
检索报告 对象比较 聚类工具 使用帮助 返回顶部