文本挖掘

作品数:3265被引量:16221H指数:49
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:郑光吕爱平姜淼郭洪涛崔雷更多>>
相关机构:中国科学院大学大连理工大学武汉大学中国中医科学院更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金教育部人文社会科学研究基金中央高校基本科研业务费专项资金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-10
视图:
排序:
基于多层动态融合的中文医疗命名实体识别
《计算机工程与应用》2024年第15期161-169,共9页林令德 刘纳 徐贞顺 李昂 李晨 
国家自然科学基金(62162001);宁夏自然科学基金(2021AAC03224,2021AAC03217)。
针对基于预训练模型的命名实体识别方法仅使用了预训练模型最后一层隐状态,忽略了各Transformer层对应不同文本信息的问题,提出一种预训练模型多层动态融合方法。采用预训练模型进行特征提取,获得模型各层隐状态序列;通过多层动态融合...
关键词:医疗文本挖掘 命名实体识别 预训练语言模型 多层动态融合 
Adapter与Prompt Tuning微调方法研究综述被引量:4
《计算机工程与应用》2023年第2期12-21,共10页林令德 刘纳 王正安 
国家自然科学基金(62162001);宁夏自然科学基金(2021AAC03224);北方民族大学校级科研启动项目(2020KYQD43);北方民族大学研究生创新项目(YCX22187)。
文本挖掘是数据挖掘的一个分支学科,涵盖多种技术,其中自然语言处理技术是文本挖掘的核心工具之一,旨在帮助用户从海量数据中获取有用的信息。近年来,预训练模型对自然语言处理的研究和发展有重要的推动作用,预训练模型的微调方法也成...
关键词:文本挖掘 自然语言处理 深度学习 预训练模型 微调方法 
基于文本挖掘的上市公司财务风险预警研究被引量:21
《计算机工程与应用》2022年第4期255-266,共12页梁龙跃 刘波 
国家自然科学基金(52000045);贵州大学人文社会科学青年项目(GDQN2020022);贵州大学经济学院创新基金(CJ202136)。
上市公司年报中的描述性文本信息是上市公司信息披露的重要组成部分,通过对上市公司信息披露文本的挖掘与分析可以提高对其财务风险的预测能力。基于BERT(bidirectional encoder representations from transformer)模型与自编码器(autoe...
关键词:财务风险预警 文本挖掘 BERT模型 自编码器 文本特征 
基于TAKE的中文关键短语提取算法研究被引量:1
《计算机工程与应用》2020年第10期115-121,共7页刘晨晖 张德生 胡钢 
国家自然科学基金(No.51875454);陕西省自然科学基础研究规划(No.2017JM5048)。
针对传统的中文关键短语提取算法所提取关键短语准确率低、歧义性强和涵盖信息量少等问题,在英文关键短语提取算法TAKE(Totally Automated Keyword Extraction)的启发下,加入基于多领域特异性的新词识别技术,并改进了原有算法的文本分...
关键词:文本挖掘 分词 词语过滤 特征计算 关键短语提取 
基于上下文语义的恶意域名语料提取模型研究被引量:4
《计算机工程与应用》2018年第9期101-108,144,共9页黄诚 刘嘉勇 刘亮 何祥 汤殿华 
保密通信重点实验室基金(No.9140C110401140C11053)
针对目前基于白名单过滤技术在海量文本中恶意域名提取的漏报、误报等问题,提出了一种基于上下文语义的恶意域名语料提取模型。该模型分别从恶意域名所在语句的上下文单词、短语进行语义分析,并利用自然语言处理技术自动生成描述恶意域...
关键词:恶意域名 文本挖掘 提取模型 恶意语料 
基于WSFT模型的深层网文本获取方法被引量:1
《计算机工程与应用》2017年第18期236-242,共7页杨贯中 李虹萱 
湖南省产学研结合重大科技成果转化项目(No.2010XK6024)
Ajax技术在深层网(Deep Web)网站开发中得到了广泛应用。针对Ajax页面多状态、状态之间强关联的特性,提出一种构建WSFT(带权状态融合树)模型的方法,来进行Ajax页面文本信息预处理。引入了文本特征树作为状态指纹进行状态捕获,优化了当前...
关键词:Ajax爬虫 带权状态融合树 文本挖掘 文本特征树 
基于文档集的生物信息挖掘模型研究被引量:2
《计算机工程与应用》2016年第24期102-106,188,共6页孙红敏 姜楠楠 李想 
针对生物医学文献的数量急剧增长,人工从文献中获取所需要的信息已不能适应生物医学文献数量迅速生长的需要。利用Stanford Parser等开源工具,采用自然语言处理技术、统计学等多种方法,提出了一种新型的生物信息挖掘模型,并对其关键技...
关键词:文本挖掘 STANFORD PARSER 文本预处理 依存关系 信息抽取 
多框架知识的不一致性检测及其修正算法被引量:1
《计算机工程与应用》2016年第23期94-97,101,共5页韩永花 雷玉霞 陈娟 王祥德 
山东省自然科学基金(No.ZR2011FQ026;No.ZR2012FQ011);山东省优秀中青年科学家科研奖励基金(No.BS2014DX005)
知识获取是文本挖掘中必要且重要的步骤之一,从文本中获取知识已成为了一种常用途径,然而不同文本知识源可能引起知识的不一性问题。为了保证所获取知识的一致性和精确性,分析了文本知识的不一致性类型,并提出了基于框架的不一致性检测...
关键词:文本挖掘 框架表示法 知识不一致 知识修正 
贸易文本的主题挖掘研究被引量:1
《计算机工程与应用》2016年第11期60-67,共8页邵浩 
教育部人文社会科学研究青年基金项目(No.13YJC630126);教育部留学回国人员科研启动基金;上海高校智库上海对外经贸大学国际经贸治理与中国改革开放联合研究中心研究基金
针对贸易文本区别于普通文本的不同特性,提出了基于贸易政策文本的主题挖掘模型,对世界贸易组织的贸易政策审议报告进行研究,归纳出文本的主要内容和主题变化趋势,为商务部和中国驻世贸组织使团提供有价值的信息辅助,从而使得快速有效...
关键词:贸易政策审议 文本挖掘 机器学习 
文本挖掘技术在互联网赌博案情分析中的应用被引量:4
《计算机工程与应用》2011年第28期113-116,248,共5页史存会 罗文华 林鸿飞 
国家自然科学基金(No.60673039;No.60973068);国家863高科技计划资助项目(No.2006AA01Z151);国家社科基金(No.08BTQ025);高等学校博士学科点专项科研基金资助课题(No.20090041110002);公安部应用创新计划项目(No.2007YYCXXJXY106)~~
当前我国正对足球赌球案件进行专项调查。针对网络赌博案情信息语义信息的不明确性和分析的复杂性,综合运用Web信息抽取技术、犯罪特征关系可视化分析技术和计算机取证技术,设计并实现了网络赌博案情分析系统。实验表明,该系统可以快速...
关键词:网络赌博 信息抽取 犯罪网络 案情分析系统 
检索报告 对象比较 聚类工具 使用帮助 返回顶部