文本相似度

作品数:494被引量:2407H指数:24
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:余正涛龙华马海群张鹏程李艳梅更多>>
相关机构:平安科技(深圳)有限公司深圳市腾讯计算机系统有限公司阿里巴巴集团控股有限公司北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家社会科学基金中央高校基本科研业务费专项资金国家高技术研究发展计划更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
“数据二十条”前后我国央地数据基础制度政策比较与评估研究
《科技情报研究》2025年第2期23-34,共12页马海群 于同同 王瀚功 张涛 
国家社会科学基金重大项目“面向数字化发展的公共数据开放利用体系与能力建设研究”(编号:21&ZD336)。
[目的/意义]探讨省级政府进一步规划数据政策的方向,旨在为各地区建立健全数据基础制度提供支撑。[方法/过程]文章采用文本相似度计算的方法,将2023年以前22个省发布的数据政策与“数据二十条”进行政策文本比较研究,选取其中8个省份的...
关键词:文本相似度 数据基础制度 “数据二十条” 数据政策评估 
基于交替语言数据重构方法的跨语言文本相似度模型
《吉林大学学报(理学版)》2025年第2期551-558,共8页王轶 王坤宁 刘铭 
吉林省高等教育教学改革研究课题项目(批准号:20213F2VB6S006);吉林省发改委基本建设基金(批准号:2022C043-2);吉林省自然科学基金(批准号:20200201157JC);吉林省教育厅人文社科研究项目(批准号:JJKH20240835SK);吉林省高教科研课题项目(批准号:JGJX24C051)。
针对现有多语言模型在预训练过程中对多语言数据集的利用效率低,导致跨语言上下文学习能力不足,进而产生语言偏差的问题,提出一种基于交替语言数据重构方法的跨语言文本相似度模型.该方法通过对称地替换平行语料中的中英文词语,形成重...
关键词:mBERT模型 文本相似度 多语言预训练模型 大模型微调 
结合依存图卷积的中文文本相似度计算研究被引量:1
《计算机工程》2025年第3期76-85,共10页胡书林 张华军 邓小涛 王征华 
湖北省重点研发计划项目(2022BAA051)。
目前中文文本相似度计算能够通过词嵌入技术在语义层面判别文本相似度,但通常忽略了文本中蕴含的丰富的句法结构信息,而以词为单位的中文句法分析与动态词嵌入模型中以字为单位的分词粒度不一致,使得当前大多数结合句法分析的研究只能...
关键词:图卷积神经网络 依存句法分析 动态词嵌入 文本相似度 注意力机制 
基于句向量加权的跨语言文本分类方法
《数据分析与知识发现》2025年第2期39-47,共9页于娟 赵慧云 巫邵诚 席运江 
国家自然科学基金项目(项目编号:72171090);福建省自然科学基金项目(项目编号:2023J01393)的研究成果之一。
【目的】减少文本分类过程中因语言差异和文本特征选择所导致的语义偏离和丢失,保留更多的文本信息。【方法】首先,采用SBERT的预训练模型进行句子表示;其次,使用句向量旋转相似度方法计算不同文本中句子的相似度并对文本内的句子加权...
关键词:跨语言 文本分类 句向量加权 文本相似度 
股票名称相似度与股价信息损失效应
《证券市场导报》2025年第2期58-67,79,共11页王意德 张兵 于琴 
研究阐释党的二十大精神国家社科基金重大项目“依法规范和引导资本健康发展研究”(批准号:23ZDA041);江苏省社会科学基金青年项目“大数据视角下重大突发公共事件对股价崩盘风险的影响机理研究”(项目编号:20EYC007)。
股票名称相似现象影响着股票市场的定价效率。本文采用文本分析中的Levenshtein距离与Jaccard距离,测度了2011—2023年A股上市公司股票名称的相似度,并实证检验了股票名称相似度与股价信息含量间的关系。研究发现:(1)股票名称相似会显...
关键词:文本相似度 市场效率 有限关注 投资者结构 投资者互动 
基于文本相似度计算的我国公共图书馆立法研究
《图书馆理论与实践》2025年第1期122-136,共15页黄丽霞 郭路颖 
2021年度黑龙江省高等教育教学改革一般研究项目“新时期创新创业教育改革推动高校内涵发展的研究”(项目编号:SJGY20210720)的研究成果之一。
文章结合各地公共图书馆事业发展状况,利用文本相似度计算对《中华人民共和国公共图书馆法》重点内容和我国23个地区发布的公共图书馆法规及规章文本进行比较研究,旨在揭示地方政府在公共图书馆事业建设中的特点,为进一步完善我国公共...
关键词:公共图书馆 立法研究 政策文本计算 文本相似度 
融合多头图注意力的文本相似度计算
《应用科技》2025年第1期205-212,共8页申晓旭 王忠燎 包训成 吴醒宇 张茂萱 张艳迪 
现有的文本相似度计算方法在处理长文本或具有复杂结构句子时,无法有效挖掘文本的深层语义,从而影响相似度计算的精度。为了解决这一问题,本文提出了一种融合图注意力的孪生网络框架,该框架结合了图神经网络的图嵌入和节点嵌入2种编码...
关键词: 图神经网络 图嵌入 注意力机制 文本表示 文本相似度 自然语言处理 深度学习 
签字审计师自恋会影响关键审计事项披露的信息含量吗?
《管理评论》2025年第1期203-216,共14页吴伟荣 刘英姿 张敏 
国家社会科学基金一般项目(21BJY124);教育部人文社会科学研究一般项目(18YJC630069);中央高校基本科研业务费专项资金资助项目(2662022JGYJ004)。
关键审计事项(CAM)的信息含量问题是颇受审计学界关注的前沿性问题。本文以2017—2021年沪深A股上市公司为研究样本,运用机器学习领域的自然语言处理技术,实证考察了签字审计师自恋与关键审计事项披露信息含量的关系。研究发现:自恋型...
关键词:关键审计事项 信息含量 审计师自恋 文本相似度 
基于专利分类号和文本相似度的双元创新识别及测度方法研究
《科技管理研究》2025年第1期10-17,共8页白全民 王东旭 贾永飞 牛晓霞 王倩 
山东省社会科学规划研究项目“基于企业创新响应的山东省未来产业培育发展路径研究”(24CGLJ09);山东省“泰山学者”工程专项经费项目“科技创新支撑黄河流域生态保护和高质量发展的策略研究”(tsqn202312232)。
学术界关于如何准确、有效地识别与测度双元创新尚未达成一致定论。通过明晰双元创新概念的内涵与外延,认为双元创新理论关注的是企业相对自身既有技术能力的创新行为,这是进行识别与测度方法设计的逻辑起点,因此在传统专利方法的基础上...
关键词:利用式创新 探索式创新 专利分析 识别方法 创新测度 人工智能 
关键审计事项披露与ESG评级分歧——基于关键审计事项数量与文本相似度的分析
《商业会计》2024年第23期53-57,共5页唐玉玲 
甘肃省审计厅2024年度重点科研课题项目“甘肃省国有企业内部审计监督工作路径优化研究”(项目编号:SJ240303);2023年兰州交通大学青年科学基金项目“ESG信息披露对审计独立鉴证的影响机制研究”(项目编号:2023031)。
随着“双碳”目标的实施,ESG(环境、社会和公司治理)的建设日益受到社会各界的广泛关注。然而,由于不同机构对ESG的评级标准存在差异,同一公司在不同评级体系中的得分往往大相径庭。这种现象不仅令投资者感到困惑,也给审计师的工作带来...
关键词:ESG评级分歧 关键审计事项 审计师行业专长 审计风险 
检索报告 对象比较 聚类工具 使用帮助 返回顶部