二元语法

作品数:16被引量:87H指数:5
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:吴春颖王士同方卫国周泓刘丹更多>>
相关机构:中国科学院江南大学北京航空航天大学国防科学技术大学更多>>
相关期刊:《计算机工程与设计》《计算机工程与应用》《计算机工程》《中文信息学报》更多>>
相关基金:国家自然科学基金国家重点基础研究发展计划教育部科学技术研究重点项目国家社会科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
HanLP下不同分词器对文本分类性能的研究
《现代计算机》2024年第14期41-44,共4页汪兰兰 
文本分类在搜索引擎技术中占据着重要的地位,文本分类第一步就是分词,分词分得准确,则在后续文字特征提取的时候也更为精确。针对以上情况,主要探究HanLP中不同分词器对文本分类后所呈现结果的影响程度,所用分词器主要为实词分词器和二...
关键词:实词分词器 二元语法分词器 朴素贝叶斯 支持向量机 
基于深度学习的二维网格空间泛在感知技术研究与应用
《电子测试》2021年第18期87-88,91,共3页袁加梅 张莉莉 丁蕾 张弛 
本项目利用人工智能语义分析方法,研究二元语法(Bigram)二分法地址特征匹配与要素重组,智能切分、重构供电服务地址,将网格化分析维度逐步精确到台区、小区、用户,为台区经理和资源分配提供数据和理论支撑,加强客户个性化、多样化服务...
关键词:台区管理 优化营商环境 二元语法二分法 二维网格空间 提质增效 
多特征融合的Voting-SRM情感分类研究被引量:10
《小型微型计算机系统》2019年第11期2269-2273,共5页赵乐 麦范金 张兴旺 
国家社科基金青年项目(17CTQ004)资助
情感分类是自然语言处理领域的一个核心问题,其目的是判断评论文本的情感极性,并挖掘其蕴含的情感价值信息.为了提取评论文本中潜在的情感信息,提高分类精度,本文提出了多特征融合的Voting-SRM情感分类方法.结合词性特征,语法特征等,提...
关键词:词性标注 二元语法 随机梯度下降 投票机制 情感分类 
基于LDA的弱监督文本分类方法被引量:3
《计算机工程与设计》2017年第1期86-91,共6页张金瑞 柴玉梅 昝红英 高明磊 
国家社会科学基金项目(14BYY096);国家自然科学基金项目(61402419;61272221);国家863高技术研究发展计划基金项目(2012AA011101);计算语言学教育部重点实验室(北京大学)开放课题基金项目(201401);国家973重点基础研究发展计划基金项目(2014CB340504);河南省高等学校重点科研基金项目(15A520098)
针对传统的文本分类方法需要大量人工标注好的训练数据,且数据标注的好坏会影响结果等问题,通过对LDA及其相关模型的研究,提出一种基于LDA的弱监督文本分类算法。无需人工标注训练数据,在处理文本时,引入词向量,保持文本中的词序,加入...
关键词:文本分类 潜在狄利克雷分布 主题 词序 二元语法 
基于最短路径的二元语法中文词语粗分模型的研究被引量:1
《现代计算机》2013年第17期7-10,共4页甘秋云 
词语粗分是分词后续处理的基础和前提,直接影响到分词系统最终的准确率和召回率。针对目前常用分词方法单一使用时存在的不足,综合机械分词的高效性和统计分词的灵活性,设计一种基于最短路径的二元语法中文词语粗分模型。实验结果表明,...
关键词:中文分词 最短路径 二元语法 词语粗分模型 
基于贝叶斯网络的二元语法中文分词模型被引量:8
《计算机工程》2010年第1期12-14,共3页刘丹 方卫国 周泓 
国家自然科学基金资助项目(70521001)
提出基于贝叶斯网络的中文分词模型,使用性能更好的平滑算法,可同时实现交叉、组合歧义消解以及译名、人名识别。应用字齐Viterbi算法求解,在保证精度和召回率的前提下,有效提高了分词效率。实验结果显示,该模型封闭测试的精度、召回率...
关键词:中文分词 贝叶斯网络 VITERBI算法 N元语法 
二元语法中文分词数据平滑算法性能研究被引量:4
《计算机工程与应用》2009年第17期33-36,共4页刘丹 方卫国 周泓 
国家自然科学基金(No.70521001)~~
将多种平滑算法应用于基于二元语法的中文分词,在1998年1月人民日报语料库的基础上,讨论了困惑度和实际分词性能之间的关系,对比分析各平滑算法的实际性能,结果表明,简单的加值平滑算法性能最优,封闭精度、召回率分别为99.68%、99.7%,...
关键词:数据平滑 中文分词 二元语法 
基于N元语法的汉语自动分词系统研究被引量:2
《微电子学与计算机》2009年第7期98-101,共4页石佳 蔡皖东 
提出一种基于N元语法的汉语自动分词系统,将分词与标注结合起来,用词性标注来参与评价分词结果.首先基于词典和一元语法统计模型生成N个最优结果作为候选集;然后对候选集进行基于二元语法统计模型的词性标注,最后利用对文本的上下文"理...
关键词:一元语法 二元语法 中文分词 词性标注 
中文词语倾向性分析处理被引量:5
《计算机工程与应用》2009年第2期131-133,共3页李娟 张全 贾宁 
国家重点基础研究发展规划(973)No.2004CB318104;中科院声学所知识创新工程项目(No.0654091431);中国科学院声学研究所“所长择优基金”(No.GS13SJJ04);中国科学院青年人才领域前沿项目(No.O754021432)~~
意见挖掘是自然语言处理研究领域的一个新热点。词语倾向性的判定是意见挖掘的基础和重要环节。该文进行了中文词语倾向性的自动判定实验。实验中采用了《现代汉语褒贬用法词典》中的词语做为褒贬判定的核心词汇,以同义词词典扩展了褒...
关键词:意见挖掘 词语倾向 二元语法 
基于词图的最大概率分词方法
《计算机工程与设计》2008年第24期6370-6372,共3页刘汉兴 朱梅阶 刘财兴 林旭东 
中文分词的方法主要可分为基于规则和基于统计两大类:前者一般借助于词图的方法,将分词问题转化为最优路径问题,通常切分结果不惟一;后者利用统计模型对语料库进行统计,计算量较大,但准确率较高。对词图和N元语法进行了介绍,并结合两者...
关键词:中文分词 词图 二元语法 最大概率 最优路径 
检索报告 对象比较 聚类工具 使用帮助 返回顶部