国家自然科学基金(60442005)

作品数:15被引量:131H指数:7
导出分析报告
相关作者:何婷婷戴文华焦翠珍姬东鸿张小鹏更多>>
相关机构:华中师范大学咸宁学院清华大学新加坡信息通信研究所更多>>
相关期刊:《计算机研究与发展》《计算机工程》《计算机与数字工程》《计算机工程与应用》更多>>
相关主题:中文信息处理并行遗传算法聚类研究聚类计算机应用更多>>
相关领域:自动化与计算机技术理学化学工程天文地球更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于混合并行遗传聚类的文本特征抽取方法研究被引量:1
《计算机科学》2008年第9期183-186,共4页戴文华 焦翠珍 何婷婷 
国家自然科学基金(No.60442005,No.60673040);国家社会科学基金(No.06BYY029);教育部重点研究项目(No.105117);湖北省教育厅科研重点项目(No.D200728002)
同义词和近义词现象以及强关联语义信息加大了文本向量的特征维数,对文本分类的效率和精度都会带来极大影响。为了有效降低文本向量的特征维数,提出一种基于混合并行遗传聚类的文本特征抽取方法。该方法首先使用K-means聚类算法进行特...
关键词:并行遗传算法 K-MEANS聚类 特征抽取 文本特征词 
基于遗传算法的自适应文本模糊聚类研究被引量:1
《计算机科学》2008年第8期134-137,共4页戴文华 焦翠珍 何婷婷 
国家自然科学基金(No.60442005,No.60673040);国家社会科学基金(No.06BYY029);教育部重点研究项目(No.105117);湖北省教育厅科研重点项目(No.D200728002)
针对FCM聚类算法对初始聚类中心的选择敏感,以及聚类数C难以确定的问题,提出一种基于遗传算法的自适应文本模糊聚类方法。该方法首先将文档集合表示成向量空间模型,并采用一种新型的可变长染色体编码方案,随机选择文本向量作为初始聚类...
关键词:遗传算法 FCM聚类 文本聚类 模糊聚类 
基于并行遗传算法的K-means聚类研究被引量:17
《计算机科学》2008年第6期171-174,共4页戴文华 焦翠珍 何婷婷 
国家自然科学基金(No60442005,No60673040);国家社会科学基金(No06BYY029);教育部重点研究项目(No105117);湖北省教育厅科(NoD200728002)
针对传统K-means聚类算法对初始聚类中心的选择敏感,以及聚类数K难以确定的问题,提出一种基于并行遗传算法的K-means聚类方法。该方法采用一种新型的可变长染色体编码方案,随机选择样本点作为初始聚类中心形成染色体,然后结合K-means算...
关键词:并行遗传算法 可变长染色体编码 K-MEANS算法 聚类 
基于特征信息提取的中文自动文摘方法被引量:3
《计算机应用与软件》2008年第5期31-32,50,共3页叶星火 胡珀 张小鹏 
国家自然科学基金(60442005);教育部科学技术研究重点项目(105117)。
提出了一种基于特征信息提取的中文自动文摘方法。通过对文章中可能影响文摘句提取质量的若干特征进行分析,设计了一种基于特征信息提取的句子重要度计算方法,并依此来抽取文摘句以生成摘要。实验结果验证了该方法的有效性,是对中文自...
关键词:自动文摘 特征信息提取 自然语言理解 
基于小生境混合遗传算法的文本特征词聚类研究
《计算机科学》2008年第1期202-203,223,共3页戴文华 何婷婷 焦翠珍 
咸宁学院科研重点项目(No.KZ0637);国家自然科学基金(No.60442005,No.60673040);国家社会科学基金(No.06BYY029);教育部科学技术研究重点项目(No.105117)基金资助
提出一种基于小生境混合遗传算法的文本特征词聚类方法。该方法首先采用贝叶斯语义模型对语料库进行统计分析,并以K-L距离度量特征词间的距离,然后将小生境遗传算法与K-Means算法相结合,对文本特征词进行聚类,为文本特征词聚类提供了较...
关键词:小生境 遗传算法 K—L距离 K-MEANS聚类 特征词聚类 
特定领域本体自动构造方法被引量:16
《计算机工程》2007年第22期235-237,共3页何婷婷 张小鹏 
国家自然科学基金资助项目(60442005);教育部科学技术研究基金资助重点项目(105117)
提出了一种自动构造特定领域本体的方法,该方法应用术语抽取和多重聚类技术。在术语抽取阶段,通过术语在专业语料与背景语料中出现概率的对比,采用LLR公式对术语进行评分,取得了更好的抽取效果。在层级关系发现过程中,采用上下文共现信...
关键词:本体 LLR 术语抽取 聚类 k-medoids 
基于混合并行遗传算法的文本聚类研究被引量:11
《中文信息学报》2007年第4期55-60,共6页何婷婷 戴文华 焦翠珍 
国家自然科学基金资助项目(60442005);国家自然科学基金资助项目(60673040);国家社会科学基金资助项目(06BYY029);教育部科学技术研究重点项目资助(105117)
针对传统K-Means聚类算法对初始聚类中心的选择敏感,易陷入局部最优解的问题,提出一种基于混合并行遗传算法的文本聚类方法。该方法首先将文档集合表示成向量空间模型,并在文档向量中随机选择初始聚类中心形成染色体,然后结合K-Means算...
关键词:计算机应用 中文信息处理 并行遗传算法 K—Means聚类 文本聚类 向量空间模型 特征抽取 
基于质子串分解的中文术语自动抽取被引量:21
《计算机工程》2006年第23期188-190,共3页何婷婷 张勇 
国家自然科学基金资助项目(60442005);国家"973"计划基金资助项目(2004CB318104);教育部科学技术研究基金资助重点项目(105117);国家语委语言文字应用"十五"规划基金资助重点项目(ZDI105-B01)
针对中文术语构成特点,提出了一种基于质子串分解的术语自动抽取方法,将词分为2类:结构简单的质词和有复杂结构的合词;使用参数F-MI抽取结构简单的质词;并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的合词。实验结果显示,该...
关键词:质子串分解 术语自动抽取 C—value 互信息 
基于DCM的中文文本分类被引量:1
《计算机工程与应用》2006年第34期157-159,共3页骆昌日 张新华 何婷婷 骆世广 
国家973重点基础研究发展规划资助项目(2004CB318104);国家自然科学基金资助项目(60442005)。
当前提出的中文文本分类或多或少都存在分类速度或分类效果不佳的问题。使用DCM分类方法,采用国家语委平衡语料库进行分类测试,取得了开放测试平均查全率90.35%、平均准确率90.87%和封闭测试平均查全率98.36%、平均准确率98.74%的分类效...
关键词:文本分类 DCM 中心向量法 
基于种子自扩展的命名实体关系抽取方法被引量:25
《计算机工程》2006年第21期183-184,193,共3页何婷婷 徐超 李晶 赵君喆 
国家自然科学基金资助项目(60442005);教育部科学技术研究基金资助重点项目(105117)
命名实体间关系的抽取是信息抽取中的一个重要研究问题,该文提出了一种从大量的文本集合中自动抽取命名实体间关系的方法,找出了所有出现在同一句子内、词语之间的距离在一定范围之内的命名实体对,把它们的上下文转化成向量。手工选取...
关键词:命名实体 关系抽取 自学习 
检索报告 对象比较 聚类工具 使用帮助 返回顶部