N-GRAM模型

作品数:58被引量:249H指数:8
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:艾斯卡尔艾木都拉王晓龙陈蓉于中华赵铁军更多>>
相关机构:哈尔滨工业大学新疆大学清华大学北京邮电大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家社会科学基金教育部人文社会科学研究基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
英语写作名词短语搭配辅导系统探究——基于N-gram模型
《上海建桥学院学报》2025年第1期25-28,共4页任维 
1引言。对于第二语言学习者和教师来说,如何恰当地运用词汇和语法完成写作任务,一直是一个令人困惑的难题。当今的NLP研究在如何评分或评估语言学习者的写作方面,已经取得了巨大进展,强大而成功的评分系统和网站,例如Grammarly、Paper C...
关键词:写作任务 第二语言学习者 评分系统 英语写作 短语搭配 系统探究 
基于N-gram模型的多层融合气象灾害预警文本检验方法被引量:1
《武汉理工大学学报(信息与管理工程版)》2023年第6期961-966,共6页兰海波 宋瑛瑛 曹之玉 朱小祥 沈晨笛 王然 
气象灾害预警信息是直接对政府部门和公众进行发布的重要内容,是综合防灾减灾的第一道防线。为提升气象预警信息发布的质量,提出了气象预警文本质量检验模型。通过对全国气象历史预警信息内容进行特征分析,设计了适合气象预警信息特征...
关键词:气象灾害预警文本 融合分词 多级检验模型 N-GRAM模型 多模式融合 
N-Gram模型下网络客户端病毒防御方法仿真被引量:1
《计算机仿真》2022年第10期400-404,共5页孙茜 吴鸣 
针对当前的客户端病毒防御方法无法获取病毒的特征向量,导致病毒防御不具有针对性等问题,提出一种基于N-Gram模型的网络客户端病毒防御方法。分析不同长度的N-Gram特征对网络客户端病毒检测的效果,并通过N-Gram模型获取病毒的特征向量,...
关键词:模型 网络客户端 病毒防御 决策算法 
基于混合N-Gram模型和XGBoost算法的内部威胁检测方法被引量:1
《计算机与现代化》2022年第8期99-105,共7页孙丹 饶兰香 施炜利 孟莎莎 胡少文 胡必伟 应嵩 
江西省科技计划项目(20194BBE50087);江西省重点研发计划项目(20202BBEL53003)。
随着政府企事业单位网络安全机制的建立健全,单纯从外部进入目标系统的攻击门槛越来越高,导致内部威胁逐渐增多。内部威胁区别于外部威胁,攻击者主要来自于内部用户,使得攻击更具隐蔽性,更难被检测。本文提出一种基于混合N-Gram模型和XG...
关键词:混合N-Gram模型 XGBoost算法 内部威胁 SEA数据集 评价指标 
基于N-gram模型的网络异常流量监测应用研究被引量:3
《电脑编程技巧与维护》2022年第6期157-159,共3页黄雅诗 
以网络异常流量为研究对象,采用N-gram算法进行特征提取,以此建立基于N-gram模型的网络异常流量监测模型,从而进行危险预警。与传统方法相比较,该模型识别异常流量特征的准确率平均提升约38%,能在危险预警时达到更好的效果,降低了人工...
关键词:网络异常流量 N-GRAM模型 流量监测 特征提取 
基于NLP的中医医案文本快速结构化方法被引量:4
《大数据》2022年第3期128-139,共12页肖晓霞 刘明婷 杨冯天赐 刘鉴建县 杨阳 石月 
国家重点研发计划基金资助项目(No.2017YFC1703300);湖南中医药大学信息科学与工程学院学科开放基金项目(No.2018DK02)。
中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法。将《中国现代...
关键词:N-GRAM模型 自然语言处理 中医医案 中文分词 光学字符识别 
基于特征权重的词向量文本表示模型被引量:8
《西安工程大学学报》2022年第1期108-114,共7页蒋延杰 李云红 苏雪平 张蕾涛 贾凯莉 陈锦妮 
国家自然科学基金(61902301);西安市科技局高校人才服务企业项目(2019217114GXRC007CG008-GXYD7.13)。
针对传统文本表示方法无法准确表达文本信息、稀疏维度高等问题,提出基于特征权重的词向量文本表示模型。通过Glove模型获得词向量,然后分别与TF-IDF、N-Gram模型相结合,分析考虑了文本的全局信息,解决了传统表示方法中稀疏维度高的问题...
关键词:TF-IDF模型 N-GRAM模型 Glove模型 文本表示 
基于改进的N-gram模型和知识库的文本查错算法被引量:9
《计算机应用与软件》2021年第10期310-315,320,共7页王琼 旷文珍 许丽 
中国铁路总公司科技研究开发计划重点项目(2016X003-H);甘肃省工业交通自动化工程技术研究中心2019年开放基金项目(GSITA201904)。
针对语音识别引擎识别后文本容易发生散串错误和同音字错误,提出一种基于改进的N-gram模型和专业术语查错知识库的查错算法。采用Witten-Bell平滑算法解决N-gram模型训练过程中数据稀疏问题,并对N-gram模型增加权重分配,增强模型对散串...
关键词:N-GRAM模型 铁路车务标准用语 散串错误 专业术语查错知识库 同音字错误 
Length-Ware限制聚类的Markov加密流量分类研究被引量:1
《重庆理工大学学报(自然科学)》2021年第5期118-126,共9页宫光霖 易军凯 张雅聪 
国家自然科学基金项目(U1636208)。
为解决网络应用加密传输中大部分分析加密流量的方法忽略通信维持的简化阶段的流量分类,并且网络中应用指纹有大量重复的问题,提出一种新型的加密流量分类方法。将报文长度作为重要的特征分析,通过高斯混合模型建模解决应用指纹的重复问...
关键词:加密流量分类 限制聚类 N-GRAM模型 
面向电视台录音采访文字校对软件被引量:1
《福建电脑》2021年第3期1-4,共4页韦文熠 王沛文 赵莹鑫 
北京信息科技大学2020年大学生创新创业训练计划项目(No.5102010805)资助。
在目前的电视台采访和录音中,有大量的文本任务需要使用语音识别软件进行从语音向文字的转换。如今语音识别的准确率虽然已经足够出色,但对于电视台等严谨的专业领域效果一般,其结果还不能完全信任。由于缺少自动有效地对识别结果进行...
关键词:新闻播报 电视台录音采访 通用领域 专业领域 N-GRAM模型 Seq2Seq模型 机器学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部