李湘东

作品数:45被引量:290H指数:9
导出分析报告
供职机构:武汉大学信息管理学院更多>>
发文主题:文本分类LDA模型书目信息非人灵长类动物LDA更多>>
发文领域:自动化与计算机技术文化科学医药卫生生物学更多>>
发文期刊:《情报杂志》《计算机应用》《武汉大学学报(医学版)》《情报科学》更多>>
所获基金:国家社会科学基金国家科技重大专项湖北省高校图工委科研基金教育部留学回国人员科研启动基金更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
结合短文本扩展和BERT的商品评论文本自动分类被引量:5
《信息资源管理学报》2023年第1期129-139,共11页李湘东 孙倩茹 石健 
针对商品评论文本具有短文本及表述用词不规范的特点,探讨如何实现商品评论文本按照商品种类进行自动归类并提高其分类效果。通过TF-IDF和LDA构建训练集的核心词集,利用Word2Vec相似度计算方式对短文本进行特征扩展获得的商品评论文本...
关键词:商品评论文本 短文本 特征扩展 Word2Vec BERT 
基于BERT-MLDFA的内容相近类目自动分类研究--以《中图法》E271和E712.51为例被引量:1
《数字图书馆论坛》2022年第2期18-25,共8页李湘东 石健 孙倩茹 贺超城 
武汉大学青年研究中心调研课题“高校大学生‘内卷’机制的建模与仿真研究”(编号:20210407)资助。
针对《中图法》中具有关联度大、区分度小等特点的内容相近类目,探讨利用深度学习来提升分类效果的方法。本文构建BERT-MLDFA模型,即通过多层级注意力机制对BERT不同层参数进行动态融合,并在任务数据集上预训练,进而以《中图法》中E271...
关键词:《中图法》 深度学习 BERT 自动分类 
共通语义空间下的跨文献类型文本自动分类研究被引量:3
《数据分析与知识发现》2018年第9期66-73,共8页李湘东 高凡 李悠海 
国家社会科学基金项目"多种类型文本数字资源自动分类研究"(项目编号:15BTQ066)的研究成果之一
【目的】解决不同文献类型文本之间因写作风格和用词习惯不同而产生的语义差异问题。【方法】选取同时出现在两个不同文献类型文本集合中的领域无关特征和只在其中某一个集合中出现的领域相关特征,利用领域无关特征,对分属两个集合的领...
关键词:共通语义空间 文本自动分类 谱聚类 跨领域分类 
内容相近类目实现自动分类时相关分类技术的比较研究——以《中图法》E271和E712.51为例被引量:5
《图书馆杂志》2018年第6期11-21,30,共12页李湘东 阮涛 
对《中图法》中内容极为相似的两个类别,开展基于机器学习的自动分类(两类分类)研究。以《中图法》中E271和E712.51两个类别的书目信息作为两类分类的对象,对涉及的CHI、IG和MI等特征选择法,TF和TF*IDF等加权方式,KNN、NB和SVM等分类算...
关键词:两类分类 《中国图书馆分类法》 特征选择 特征加权 文本分类 
基于主题语义扩展的混合类型数字资源分类研究被引量:3
《情报理论与实践》2018年第5期143-149,136,共8页巴志超 李湘东 马亚雪 徐健 
国家社会科学基金项目"多种类型文本数字资源自动分类研究"的成果之一;项目编号:15BTQ066
为满足数字图书馆各种类型数字化资源统一分类组织的需要,文章着重对数字图书馆中多种类型文献混合分类的可行性进行探索与分析。引入语义主题模型构建方法,结合外部知识库Wikipedia进行语义扩展,构建一种基于主题语义扩展的混合类型文...
关键词:主题模型 语义扩展 数字资源 混合分类 
融合去噪技术和动态主题数的新闻话题分析框架研究被引量:4
《情报科学》2018年第4期14-21,共8页李湘东 阮涛 潘练 
【目的/意义】使用聚类技术在话题分析之前对文本集中的噪声文本进行识别筛查,并采用文档相似度分布及困惑度等对去噪和建模效果加以检验。【方法/过程】在提高文本集质量之后,借助LDA概率主题模型对新闻文本集进行话题抽取,通过计算相...
关键词:话题跟踪与分析 LDA模型 DBSCAN 噪声文本 
互信息特征选择法在《中图法》内容相似类目中的运用及改进——以E271和E712.51为例被引量:2
《数字图书馆论坛》2018年第1期46-52,共7页李湘东 阮涛 
针对内容相似的两个类目间存在大量共同特征而难以自动区分的特点,提出一种改进的互信息特征选择法,以提高两类文本自动分类的效果。以《中国图书馆分类法》中E271(中国陆军)和E712.51(美国陆军)两个类别的书目信息作为文本分类的对象,...
关键词:内容相似类目 中国图书馆分类法 两类分类 互信息 特征选择 
浅谈ABSL-3实验室档案管理的内容、问题及对策被引量:3
《人力资源管理》2017年第11期340-342,共3页胡琼 陈秋艳 王芬 李湘东 
国家重点研发计划课题<高等级病原微生物实验室培训体系的建立和应用示范>(2016YFC1202203)
高致病性病原微生物实验室档案是实验活动和管理工作的重要记录和见证材料。做好实验室档案管理既是国家相关法规的要求,也是规范实验室生物安全管理的重要抓手。本文以武汉大学ABSL-3实验室为例,探讨了此类实验室档案管理工作重要性,...
关键词:ABSL-3实验室 档案 管理 
基于维基百科的多种类型文献自动分类研究被引量:11
《数据分析与知识发现》2017年第10期43-52,共10页李湘东 阮涛 刘康 
国家社会科学基金项目"多种类型文本数字资源自动分类研究"(项目编号:15BTQ066)的研究成果之一
【目的】通过基于维基百科的特征扩展解决由于不同类型文献而产生的特征不匹配等问题,以提高文本分类效果。【方法】在特征扩展之前,对TF-IDF加以改进,提出并使用一种新的特征选择方法 CDFmax-IDF获得候选词集;在使用维基百科进行特征...
关键词:多种类型文献 文本分类 特征选择 特征扩展 维基百科 
基于复合加权LDA模型的书目信息分类方法研究被引量:14
《情报学报》2017年第4期352-360,共9页李湘东 丁丛 高凡 
国家社会科学基金项目"多种类型文本数字资源自动分类研究"(15BTQ066)
以书目信息为分类对象的自动分类研究对信息资源组织具有重要意义。本文以概率主题模型LDA作为书目信息的文本表示模型,以克服因文本短小而产生的特征稀疏问题;以书目信息的体例结构和所在类目的类别区分能力分别实现两种不同的特征加...
关键词:文本分类 LDA模型 特征加权 书目信息 文本体例结构 
检索报告 对象比较 聚类工具 使用帮助 返回顶部