TFIDF

作品数:118被引量:955H指数:16
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:唐剑波赵伟燕徐朝军王宇牛永洁更多>>
相关机构:哈尔滨工业大学湖南大学上海交通大学华南理工大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划重庆市自然科学基金安徽省高校省级自然科学研究项目更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种引入元路径相似性度量的材料实体检索方法
《计算机应用研究》2024年第9期2781-2786,共6页黄华泽 胡紫璇 游进国 黄星瑞 陶静梅 易健宏 
国家自然科学基金资助项目(62062046)。
近年来,随着材料数据的积累以及“材料基因组计划”的普及,面对大量需要处理和管理的材料数据,快速准确地检索并获取相应信息已成为一个重要问题。传统的检索方法由于仅能查询某一材料的相关信息,并且存在检索结果不全面、无法处理复杂...
关键词:材料相似度 metapath2vec TFIDF-CBOW 元路径权重 
基于Ngram-TFIDF的深度恶意代码可视化分类方法被引量:1
《通信学报》2024年第6期160-175,共16页王金伟 陈正嘉 谢雪 罗向阳 马宾 
国家自然科学基金资助项目(No.62072250,No.62172435,No.U20B2065);中原科技创新领军人才基金资助项目(No.214200510019);江苏自然科学基金资助项目(No.BK20200750);河南省网络空间态势感知重点实验室开放基金资助项目(No.HNTS2022002);山东省计算机网络重点实验室开放课题基金资助项目(No.SDKLCN-2022-05)。
随着恶意代码规模和种类的不断增加,传统恶意代码分析方法由于依赖于人工提取特征,变得耗时且易出错,因此不再适用。为了提高检测效率和准确性,提出了一种基于Ngram-TFIDF的深度恶意代码可视化分类方法。结合N-gram和TF-IDF技术对恶意...
关键词:深度学习 数据可视化 恶意代码检测和分类 
基于图神经网络的专利文本分类研究
《竞争情报》2024年第2期24-34,共11页魏雯婕 张更平 
2023年度上海市科技情报学会战略性新兴产业情报专项课题“先进技术在专利分析中的应用”的研究成果之一。
传统专利分类由专家逐件审阅,随着大数据、人工智能和自然语言处理技术的快速发展,专利文本自动分类正在成为学界、业界的重要研究方向之一。文本分类技术可以用于判断专利申请是否获得授权,帮助审查员自动化处理和分析专利申请文件,从...
关键词:专利分类 图卷积神经网络 Doc2vec TFIDF 表示学习 
基于TFIDF+LDA和Mini Batch K⁃means算法的在线课程推荐方法研究
《现代计算机》2023年第23期15-20,共6页严武军 王丽蓉 
在线教育资源急剧增长让学习者难以抉择,研究在线课程分类推荐,能帮助学习者快速获取所需资源。首先将潜在狄利克雷分配算法融入词频-逆向文件频率算法对数据进行预处理,生成词向量矩阵;之后采用Mini Batch K-means算法训练聚类模型,并...
关键词:词频逆向文件频率 潜在狄利克雷分配 Mini Batch K-means 在线课程推荐 
基于BERT-BiLSTM-TFIDF的产品研发文档关键词抽取方法被引量:1
《工业工程与管理》2023年第2期99-106,共8页卢啸岩 郑宇 昝欣 
国家科技支撑计划课题(2015BAF18B00);国家自然科学基金资助项目(51505286);国家工信部智能制造专项(MC-201720-Z02)。
制造企业现有的内部知识管理系统大多通过人工选取产品研发文档标签,效率低下。应用自然语言处理技术抽取文档关键词作为文档标签有助于制造企业知识管理系统智能化。针对产品研发文档关键词抽取问题,提出了BERT-BiLSTM-TFIDF关键词自...
关键词:关键词抽取 产品研发文档 BERT-BiLSTM-TFIDF 
基于改进FastText算法的整车检测质量问题判定
《北京汽车》2022年第5期27-32,共6页白桢文 黄涛 秦小兵 吴健 
对于整车检测时发现的质量问题,终检人员在进行责任部门判定时,存在耗时长、精度低问题,为此提出一种基于改进FastText算法的整车检测质量问题判定方法。将2020年整车生产中75 238条不良数据作为数据集,进行数据预处理后,将其作为FastT...
关键词:整车检测 TFIDF FastText SVM 
突发公共卫生事件下多元主体信息披露内容及特征演化研究被引量:6
《情报资料工作》2022年第4期16-26,共11页龚栩 邓胜利 
国家自然科学基金项目“信息生态链视角下在线知识社区用户贡献行为评价及预测研究”(批准号:71974149)的研究成果之一。
[目的/意义]研究旨在定量测量突发公共卫生事件多元主体的信息披露水平,为研究突发公共卫生事件多元主体的信息披露行为提供新的分析框架。从数据层面揭示我国疫情期间信息披露的现状,为政府等相关主体调整信息发布内容、改善信息披露...
关键词:信息披露 社会渗透理论 生命周期 多元主体 TFIDF-LDA模型 
基于TFIDF+LSA算法的新闻文本聚类与可视化被引量:10
《计算机技术与发展》2022年第7期34-38,45,共6页郝秀慧 方贤进 杨高明 
国家自然科学基金面上项目(61572034);安徽省高校自然科学基金资助项目(KJ2019A0109)。
近几年来,文本聚类技术作为机器学习领域一种无监督学习的方法,也越来越成为数据挖掘领域备受关注的技术之一。将小规模的文本数据聚为几类,在一定程度上说是一件比较容易实现的工作。可是,当面对大量高维的中文文本数据时,由于在这种...
关键词:词频反文档频率 潜在语义分析 文本聚类速度 文本聚类可视化 kmeans 
文本分类中TF-IDF算法的改进研究被引量:12
《计算技术与自动化》2022年第2期84-86,共3页吴宗卓 
文本分类中的一个主要问题是如何提高分类准确性。为了提高分类准确性,提出了一种基于TF-IDF的新的加权方法TF-IDF-IF。此方法引入了一个新的参数来表示类内特征,它用来计算一个类中文档中的术语频率。实验使用CHI卡方统计特征选择方法...
关键词:文本分类 特征选择 CHI平方统计 TFIDF 分类准确性 
Benchmarking Performance of Document Level Classification and Topic Modeling被引量:1
《Computers, Materials & Continua》2022年第4期125-141,共17页Muhammad Shahid Bhatti Azmat Ullah Rohaya Latip Abid Sohail Anum Riaz Rohail Hassan 
Text classification of low resource language is always a trivial and challenging problem.This paper discusses the process of Urdu news classification and Urdu documents similarity.Urdu is one of the most famous spoken...
关键词:Deep neural network machine learning natural language processing TFIDF sparse matrix cosine similarity CLASSIFICATION linear discriminant analysis gradient boosting 
检索报告 对象比较 聚类工具 使用帮助 返回顶部