国家自然科学基金(60775041)

作品数:13被引量:46H指数:4
导出分析报告
相关作者:郑家恒谭红叶何苑李荣张虎更多>>
相关机构:山西大学长治学院忻州师范学院湖南大学更多>>
相关期刊:《计算机工程与设计》《计算机与数字工程》《电脑开发与应用》《广西师范大学学报(自然科学版)》更多>>
相关主题:遗传算法基于遗传算法隐马尔可夫模型中文信息处理网站优化更多>>
相关领域:自动化与计算机技术更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于遗传算法和隐马尔可夫模型的Web信息抽取的改进被引量:8
《计算机科学》2012年第3期196-199,215,共5页李荣 胡志军 郑家恒 
国家自然科学基金(60775041);山西省高校科技开发项目(20101120)资助
为了进一步提高Web信息抽取的准确性和效率,针对Web信息抽取的遗传算法和一阶隐马尔可夫模型混合方法在初值选取和参数寻优上的不足,提出了一种遗传算法和二阶隐马尔可夫模型内嵌结合的改进方法。在分层预处理阶段,利用格式信息和文本...
关键词:WEB信息抽取 遗传算法 二阶隐马尔可夫模型 分层 
时间关系识别研究进展被引量:6
《中文信息学报》2011年第5期44-52,共9页谭红叶 郑家恒 梁吉业 
国家自然科学基金(60775041);山西省自然科学基金(2011011016-2)
时间关系识别是自然语言中语义处理的一个重要任务,近年来得到了广泛的关注和快速的发展。该文参考大量的文献资料,总结了当前时间关系识别在标准、资源和评测中的进展,分析了研究中采用的多种方法和技术,探讨了研究中存在的问题和未来...
关键词:时间关系 自然语言处理 综述 
基于多结构特征的垃圾博客识别研究被引量:6
《计算机工程与设计》2010年第22期4932-4935,共4页何苑 谭红叶 
国家自然科学基金项目(60775041)
为解决日益严重的垃圾博客问题,对产生垃圾博客的作弊技术和相应的识别技术进行了研究。通过对大量中文垃圾博客的分析,结合对作弊者目的的研究,提出了从用户名、发帖时间间隔、博文内容、锚文本和链接地址、分类标签等博客的结构特征...
关键词:中文信息处理 垃圾博客 多结构特征 朴素贝叶斯 支持向量机 
汉语句法树库一致性检验方法研究被引量:2
《广西师范大学学报(自然科学版)》2010年第1期139-142,共4页魏莉 谭红叶 郑家恒 孙健 
国家自然科学基金资助项目(60775041)
为了进一步提高完全句法分析标注的准确率,对人工修正的完全句法分析语料进行剖析,从分词、词性和句法结构三个层面检验一致性,总结标注结果不一致的类型,并提出基于分层的自动发现不一致现象的方法及相应的消解策略。实验表明,利用该...
关键词:中文信息处理 语料库 完全句法分析 一致性 
一种面向搜索引擎的基于集合模型的搜索算法
《山西农业大学学报(自然科学版)》2009年第6期529-532,共4页王路芳 张虎 
国家自然科学基金(60775041)
现代搜索引擎中的搜索算法已经成为影响搜索引擎效率的一个关键,通过对现有搜索引擎中搜索算法的研究分析,提出了一种面向搜索引擎的基于集合模型的搜索算法,该方法利用集合运算方便并、交运算的特点,把检索问题转化为集合运算问题,这...
关键词:搜索引擎 倒排索引 关键词 
面向中文文本的欺骗行为检测方法研究被引量:2
《山西大学学报(自然科学版)》2009年第4期541-545,共5页郑家恒 张虎 魏善德 谭红叶 
国家自然科学基金(60775041)
随着网络应用的扩展,个人或组织会收到或存储越来越多的信息,计算机中介通讯中时刻有大量的文本信息传输,然而人们仍然没有提出有效的办法识别其中的欺骗信息,因此,提出一种能自动检测欺骗的方法是非常迫切的.由于目前关于中文欺骗语料...
关键词:欺骗检测语料库 欺骗检测模型 分类 
基于遗传算法的隐马尔可夫模型在名词短语识别中的应用研究被引量:4
《计算机科学》2009年第10期244-246,261,共4页李荣 郑家恒 郭梅英 
国家自然科学基金(60775041);山西省忻州师范学院科研基金(200623)资助
为了进一步提高名词短语的识别精度,针对遗传算法和隐马尔可夫模型各自的特点,提出一种基于遗传算法的隐马尔可夫模型识别方法。该方法是在高准确率词性标注的基础上实现的。在训练阶段,用遗传算法获取HMM参数;识别阶段先用一种改进的Vi...
关键词:短语识别 遗传算法 隐马尔可夫模型 VITERBI算法 层次分析 
大规模语料库可用性评测方法被引量:1
《计算机工程与应用》2009年第16期134-137,共4页李艳红 郑家恒 
国家自然科学基金(No.60775041)~~
提出了一种大规模语料库可用性评测方法。通过分析语料库工程的生命周期,构建了大规模语料库可用性评测指标体系,运用层次分析-模糊综合评价方法实现了语料库的可用性评测,给出了语料库的可用性级别。分析语料库的评测结果,确定影响语...
关键词:大规模语料库 可用性评价 层次分析法 模糊综合评价 
搜索引擎优化策略研究被引量:11
《计算机与数字工程》2009年第7期60-63,共4页何苑 郝梦岩 
国家自然科学基金项目(编号:No.60775041)资助
随着Internet的发展及网络资源越来越丰富,搜索引擎所起的作用也越来越大。因此搜索引擎优化作为一种可以提升网站在搜索引擎中的排名的网站优化技术,得到了广泛的关注。如何获得高的搜索引擎排名对网站特别是商务网站显得越来越重要。...
关键词:网站优化 搜索引擎优化 策略 
基于最大熵方法进行动词搭配的自动标注
《计算机工程与应用》2009年第3期135-137,共3页白妙青 郑家恒 
国家自然科学基金(No.60775041)~~
搭配是汉语自动句法分析的重要知识源,而动词是句法分析的核心和前提。通过对已标注真实文本的分析,构造了动词搭配对的上下文变量信息特征模板,给出利用最大熵方法抽取动词—动词搭配,对待测的1000句汉语句子应用最大熵方法自动识别出...
关键词:语料 搭配 特征选择 最大熵 
检索报告 对象比较 聚类工具 使用帮助 返回顶部