云南高校图书馆联盟文献共享服务平台- N-GRAM

N-GRAM: 作品数：181被引量：693H指数：12; 导出分析报告; 相关领域：自动化与计算机技术更多>>; 相关作者：王晓龙李荣陆李思舒张永铮关毅更多>>; 相关机构：北京邮电大学哈尔滨工业大学中国科学院新疆大学更多>>; 相关期刊：更多>>; 相关基金：国家自然科学基金国家高技术研究发展计划国家社会科学基金中央高校基本科研业务费专项资金更多>>

一种改进的基于n-gram的古汉语断句与标点方法: 《集美大学学报(自然科学版)》2025年第2期198-204,共7页秦瑞琳; 福建省中青年教师教育科研项目“情感感受的量子计算模型及其仿真实现”(JAT210243);厦门市自然科学基金项目“引入量子机制的机器人情感计算模型及其仿真实现”(3502Z202473063)。; 古汉语文本的自动断句与标点对提高我国古籍整理的自动化水平具有重要意义。现有古汉语断句与标点算法大多缺少对前后标点间相互影响的考虑。针对这一问题,本文提出一种改进的基于n-gram的古汉语断句与标点方法。该方法综合考虑了二元...; 关键词：古汉语断句标点 N-GRAM模型深度学习

A Contrastive Learning Framework for Keyphrase Extraction: 《Data Intelligence》2024年第4期1032-1056,共25页Jing Song Xian Zu Fei Xie; funded by the National Natural Science Foundation of China(No.61503116);the Special Project of Provincial Scientific Research Platform of Hefei Normal University(No.2020PT15);the Natural Science Foundation of the Anhui Higher Education Institutions of China(No.KJ2021A0902,No.2022AH052140); Keyphrase extraction aims to extract important phrases that reflect the main topics of a document. Recently, deep learning methods are used to model semantic information and rank candidates based on the similarities b...; 关键词：Keyphrase extraction Contrastive learning Supervised n-gram features Document embedding

基于N-gram改进特征的ACFG在GCC编译器版本识别中的应用: 《数学建模及其应用》2024年第4期86-98,共13页陈舒董晨洋叶慧斌韩铨钟秀艺; 福建省2023年本科高校教育教学研究项目(FBJY20230193)。; 探讨基于N-gram改进特征的ACFG,与优化后的LightGBM分类器相结合,以实现对GCC编译器版本的精确识别.研究重点在于关键特征的提取和判别函数的构建.在识别编译结果的关键特征时,构建了N-gram关联模型,以关联寄存器与操作码的统计特征,确...; 关键词：GCC编译器版本识别 N-GRAM ACFG LightGBM

基于Swin Transformer的遥感图像超分辨率重建: 《计算机系统应用》2024年第9期85-94,共10页孔锐冉友红; 由于遥感图像中的物体具有不确定性,同时不同图像之间的特征信息差异较大,导致现有超分辨率方法重建效果差,因此本文提出一种结合Swin Transformer和N-gram模型的NG-MAT模型来实现遥感图像超分辨率.首先,在原始Transformer计算自注意力...; 关键词：Swin Transformer 超分辨率 N-GRAM 遥感图像

基于N-gram剪枝技术的隐患文本自动评估模型: 《矿山工程》2024年第3期388-394,共7页叶洪胜刘洪周宝山兰莉邹巧兰周啟梦王海宇; 为了自动分析海上钻井平台隐患文本中蕴含的隐患响应程度信息,量化隐患严重程度,提出一种基于N-gram词袋向量的隐患响应等级量化评估模型。首先针对1565条钻井平台的现场隐患记录进行分词与过滤处理;其次再以N-gram作为特征单元重塑词...; 关键词：语义分析钻井平台 N-GRAM 词袋向量隐患量化

基于改进TF-IDF与N-Gram的恶意Web请求智能识别: 《中国信息界》2024年第6期179-182,共4页安渊杨琴杨雄; 引言目前,我国互联网基础资源高质量发展,数字化平台成为经济增长的新引擎,以在线办公、网络娱乐、公共服务和信息共享等为代表的Web应用平台呈现大规模增长趋势。随着Web应用平台的大规模增长,Web应用平台可用性和数据安全问题越来越...; 关键词：WEB应用智能识别改进版信息共享网络娱乐数字化平台数据安全问题函数优化

基于谐音干扰词替换的中文仇恨言论检测方法: 《应用科技》2024年第3期72-81,共10页王琰慧王小龙张顺香周渝皓汪才钦; 国家自然科学基金面上项目(62076006);安徽高校协同创新项目(GXXT-2021-008).; 社交网络中的仇恨言论常含有形式多变的谐音干扰词,使得现有方法难以适应此现象,不能满足即时检测的要求。针对此问题,提出一种基于谐音干扰词替换的中文仇恨言论检测方法,提取原义词替换谐音干扰词,解决原有方法处理相对滞后问题。首先...; 关键词：仇恨言论检测谐音干扰词拼音相似语法结构上下文语义 RoBERTa-wmm-ext CNN N-GRAM

融合汉字多语义与文本统计特征的中文医学新词发现研究被引量：2: 《图书情报工作》2024年第6期119-128,共10页王巍洁任慧玲李晓瑛王勖张颖; 科技创新2030-“新一代人工智能”重大项目“面向医学人工智能服务的知识体系构建和应用研究”中文医学术语体系构建(项目编号:2020AAA0104901)研究成果之一。; [目的/意义]为提高机器理解医学文本的能力,提高医学自然语言处理等上层任务效果,保障医学知识内容更新及时性、覆盖完整性,提出一种融合汉字多语义信息与文本统计特征的医学新词发现方法。[方法/过程]以规范用词的医学文献摘要数据为...; 关键词：医学新词发现 N-GRAM 多语义词向量关联置信度左右信息熵

基于核心主题特征的作者身份识别研究: 《知识管理论坛》2023年第5期351-364,共14页孟旭谢靖李春旺; [目的/意义]以主题特征在中文社交媒体文本作者识别中的使用研究为基本目的,利用Word2vec补充主题模型获取主题特征的不足,同时进一步制定策略对主题特征中的核心主题进行识别和筛选,优化主题特征的使用方法,从而提高主题特征在作者识...; 关键词：作者身份识别主题特征 N-GRAM 科研作者社交网络文本

Detecting Ethereum Ponzi Schemes Through Opcode Context Analysis and Oversampling-Based AdaBoost Algorithm被引量：1: 《Computer Systems Science & Engineering》2023年第10期1023-1042,共20页Mengxiao Wang Jing Huang; This work was supported by National Key R&D Program of China(Grant Numbers 2020YFB1005900,2022YFB3305802).; Due to the anonymity of blockchain,frequent security incidents and attacks occur through it,among which the Ponzi scheme smart contract is a classic type of fraud resulting in huge economic losses.Machine learningbase...; 关键词：Blockchain smart Ponzi scheme N-GRAM OVERSAMPLING ensemble learning

N-GRAM