中文文档

作品数:40被引量:238H指数:7
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:周水庚胡运发刘超王晓博韩晓东更多>>
相关机构:南京大学哈尔滨工程大学复旦大学武汉大学更多>>
相关期刊:《计算机与通信》《电脑爱好者》《科技创新导报》《模式识别与人工智能》更多>>
相关基金:国家自然科学基金国家高技术研究发展计划安徽省自然科学基金中国博士后科学基金更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
一种基于语义相似的中文文档抄袭检测方法
《深圳大学学报(理工版)》2020年第S01期107-111,共5页胡布焕 张晶 张凌 
中国教育和科研计算机网资助项目(NGII20190615)。
为解决在文本抄袭行为中由于避开检测而对文本内容进行的一些同义词替换、文本释义等操作问题,提出了一种基于语义相似计算的中文文档抄袭检测方法,将文档以句子为单位切分,利用word2vec模型将句子中的词语表示为词向量的形式,作为卷积...
关键词:计算机科学 自然语言处理 抄袭检测 语义相似度 词向量表示 
基于随机游走算法的中文文档信息处理模型
《青海科技》2019年第3期45-48,共4页县小平 马国俊 
甘肃民族师范学院2016年度校长科研基金项目《学习分析技术在网络学习行为和学习效果中的应用研究》(GSNUXM16-14)资助
由于中文信息处理的复杂性和特殊性,中文搜索引擎技术需要不断改进,中文搜索引擎不能直接照搬国外技术,研究和分析中文的专业知识,可以准确地发现在海量信息库中对中文信息的需求。本文在字符识别中引入了随机游走模型的字典学习和稀疏...
关键词:中文文档 信息处理模型 随机游走 数据挖掘 
基于版本控制的中文文档到源代码的自动跟踪方法被引量:2
《计算机应用》2018年第10期2996-3001,共6页沈力 刘洪星 李勇华 
中央高校基本科研业务费专项资金资助项目(2016III028)~~
软件文档和源代码之间的可追踪性研究广泛使用了信息检索(IR)技术,但由于中文文档和源代码用不同的语言书写,使用传统IR技术进行自动跟踪时会导致精度不高。针对上述问题,提出一种基于版本控制的中文文档到源代码的自动跟踪方法。首先,...
关键词:可追踪性 版本控制 自动跟踪 信息检索 软件工程 
基于索引的快速手写中文文档关键词检索被引量:2
《模式识别与人工智能》2015年第11期1033-1040,共8页喻庚 殷飞 陈友斌 刘成林 
国家自然科学基金项目(No.61305005;61273269;61175021)资助
手写文档检索很难同时保证较高的检索精度和速度.基于上述原因,文中提出快速手写中文文档关键词检索方法,大幅提高检索速度并保持检索精度.该方法基于文本行识别的候选切分-识别网格预先生成压缩的索引文件,然后在索引上快速检索关键词...
关键词:手写中文文档图像 关键词检索 索引压缩 快速检索 
基于信息丰富度的切碎中文文档自动拼接复原被引量:5
《计算机辅助设计与图形学学报》2015年第6期1039-1046,共8页赵波 周宇 张正宇 那莹 马廷淮 
国家自然科学基金(61173143);公益性行业(气象)科研专项(GYHY201506080)
针对切碎中文文档的自动拼接复原中无法利用碎纸片形状特征的问题,提出一种基于内容信息丰富度的拼接算法.首先分析了基于汉字内容的碎纸片特征表达方式;在此基础上,提出从横纵2个方面进行碎纸片特征匹配度估计的方法;最后采用信息丰富...
关键词:文档复原 中文文档 碎纸片 匹配度估计 信息丰富度 自动拼接算法 
基于主题模型与信息熵的中文文档自动摘要技术研究被引量:7
《计算机科学》2014年第B11期298-300,332,共4页李然 张华平 赵燕平 商建云 
提出了一种基于LDA模型以及信息熵的文档自动摘要技术,即通过LDA模型对文档进行浅层语义分析,得到文档的主题分布以及不同主题下的词语分布;通过对主题的分析,可以得到最能代表文档中心思想的主题,以及该主题下的词语分布。同时,提出了...
关键词:摘要 LDA模型 主题 信息熵 
中文电子文档的数学公式定位研究被引量:4
《北京大学学报(自然科学版)》2014年第1期17-24,共8页林晓燕 高良才 汤帜 
国家重点基础研究发展计划(2012CB724108);国家自然科学基金(61202232)资助
区别于传统基于图像和西文文档的公式定位方法,针对中文电子文档的特点,提出一种基于机器学习和规则相结合的独立公式和内嵌公式的定位方法。设计了适合中文文档的页面分行策略和词块划分规则;选择适合中文文档的公式特征和机器学习算法...
关键词:数学公式识别 数学公式定位 电子文档 中文文档 
基于多特征融合的中文文本关键词提取方法被引量:17
《情报理论与实践》2013年第10期105-108,共4页张建娥 
文章通过分析传统关键词提取方法的特点和存在的问题,提出基于多特征融合的中文文本关键词提取方法。该方法通过融合中文文本词语的频率、关联度、词性以及位置多种特征,有效避免了传统关键词提取方法产生的偏差。实验结果表明,该方法...
关键词:中文文档 特征融合 关键词 
基于受限玻尔兹曼机的中文文档分类被引量:3
《科技创新导报》2012年第16期35-36,共2页杨莹 吴诚炜 胡苏 
最近,许多不同类型的人工神经网络(Artificial Neural Network)已经应用于文档分类,并且得到了较好的结果。但是,大多数的模型仅使用了少量特征作为输入,因此可能没有足够的信息来对文档进行准确分类。如果输入更多的特征,将可能发生所...
关键词:文档分类 受限玻尔兹曼机 低维特征 支持向量机 
中文文档下载 当然要取中文名
《电脑迷》2011年第18期14-14,共1页远渡重洋 
最近,公司安排我做一个礼仪教育方面的报告。我通过百度文档搜索页面(http://file.baidu.com),输入关键词"礼仪教育",选择文档类型为Word文档,然后单击"百度一下"按钮.
关键词:中文文档 中文名 下载 WORD文档 文档类型 关键词 教育 礼仪 
检索报告 对象比较 聚类工具 使用帮助 返回顶部