国家高技术研究发展计划(2001AA114210)

作品数:13被引量:93H指数:5
导出分析报告
相关作者:钟义信张素香李蕾陆汝占陈群秀更多>>
相关机构:北京邮电大学上海交通大学北京大学清华大学更多>>
相关期刊:《计算机仿真》《微电子学与计算机》《小型微型计算机系统》《计算机应用》更多>>
相关主题:全信息方法论自然语言理解辨析CCD更多>>
相关领域:自动化与计算机技术语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
基于潜在语义索引和句子聚类的中文自动文摘被引量:5
《计算机仿真》2008年第7期82-85,共4页陈戈 段建勇 陆汝占 
国家自然科学基金(60496326);863计划资助项目(2001AA114210)
自动文摘是自然语言处理领域的一项重要的研究课题。提出一种基于潜在语义索引和句子聚类的中文自动文摘方法。该方法的特色在于:使用潜在语义索引计算句子的相似度,并将层次聚类算法和K-中心聚类算法相结合进行句子聚类,这样提高了句...
关键词:自动文摘 潜在语义索引 句子聚类 
现代汉语语义资源用于短语歧义模式消歧研究被引量:9
《中文信息学报》2007年第5期80-86,共7页王锦 陈群秀 
国家863高科技项目(2001AA114210)
现代汉语存在着许多歧义短语结构,仅依靠句中词性标记无法获得词与词之间正确的搭配关系。本文研究了大量包含歧义的短语实例,分析了计算机处理汉语结构时面临的定界歧义和结构关系歧义问题,在已有短语结构规则的基础上归纳出了七种结...
关键词:计算机应用 中文信息处理 现代汉语语义知识库 搭配词典 短语歧义排歧 
基于网络会话层的垃圾邮件行为识别被引量:3
《计算机工程与应用》2007年第1期167-169,共3页白秋颖 章璿 张耀龙 
国家863高技术研究发展计划资助项目(2001AA114210)。
目前最流行的邮件内容过滤技术工作在网络应用层,通过对邮件内容的分析来判别邮件的合法性,无法避免由于垃圾邮件的泛滥而造成的网络带宽资源的浪费。针对这种情况,论文提出一种基于网络会话层的垃圾邮件行为识别方法。该方法运用决策...
关键词:邮件过滤 行为识别 数据挖掘 决策树 
基于Boot Strapping的中文实体关系自动生成被引量:3
《微电子学与计算机》2006年第12期15-18,共4页张素香 李蕾 秦颖 钟义信 
国家863计划重大项目(2001AA114210)
针对中文信息抽取系统中建立提取事件模板的难点问题,基于Bootstrapping思想,提出一种简单、可行的实体关系自动生成方法,利用由种子词和种子模板组成的知识库建立学习器,采用标量聚类的方法,通过种子模板抽取更多的与种子词相似语义关...
关键词:BOOT Strapping 种子词 种子模板 标量聚类 
特定领域下关系模板的研究被引量:3
《北京邮电大学学报》2006年第5期79-83,共5页张素香 李蕾 谭咏梅 
国家"863计划"项目(2001AA114210)
以公司人事变动领域为例,针对实体关系抽取课题,从知识自动获取角度出发,基于Bootstrapping思想提出了层次知识获取模型,利用内外2层模块相互嵌套自动获取知识,获得了实体关系分析所需要的领域专用词典和模板规则.结合全信息理论,对模...
关键词:全信息理论 全信息知识库 层次知识获取 标量聚类 
实体关系的自动抽取研究被引量:10
《哈尔滨工程大学学报》2006年第B07期370-373,共4页张素香 文娟 秦颖 袁彩霞 钟义信 
国家863计划计算机主题重大基金资助项目(2001AA114210).
针对实体关系的自动获取难题,将极大熵算法和Bootstrapping算法相结合,利用Bootstrapping算法和标量聚类的思想,通过设置种子模板和种子词获取了极大熵算法中所需的特征词.结合极大熵算法,从语言的形态学、语法、语义等方面系统地...
关键词:极大熵 BOOTSTRAPPING 特征选择 实体关系抽取 评测 
全信息知识制导的科技期刊初审辅助系统被引量:2
《北京邮电大学学报》2006年第z2期127-132,共6页李卫 王枞 李蕾 郭燕慧 钟义信 
国家"863计划"项目(2001AA114210)
借鉴自动文摘领域复合式文摘的思想,提出了一个全信息知识制导的科技期刊初审辅助系统框架,并在车牌自动识别研究领域中实现.该系统根据科技论文的特点,结合编辑人员的工作经验,将编辑初审细化为4个方面的评判,在基于全信息的领域知识...
关键词:科技期刊 初审 全信息 内容理解 
弹性音节拼接与特征空间轨迹匹配的关键词检测
《计算机工程》2005年第23期154-155,共2页张传坤 吴亚栋 陆汝占 
国家"863"计划基金项目"中文信息处理应用基础研究"(2001AA114210)子课题(2001AA114210-11)资助项目
不同的汉语语音关键词识别系统,以关键词为单位建立模板工作量大而且可重用性较差,而以音节为单位可以很好地提高重用性。将弹性音节拼接与具有较高性能的基于特征空间轨迹匹配的关键词检测相结合构建识别系统,实验结果表明该系统具有...
关键词:关键词识别 特征空间轨迹 弹性音节拼接 
后时连接成分辨析被引量:6
《解放军外国语学院学报》2005年第4期32-36,共5页金晓艳 彭爽 
863计划(2001AA114210);973计划(2004CB318102)的资助。
后时连接成分是一个语义小类,它由3组共9个语义比较接近的时间连接成分构成。从时量上看,后时连接成分虽然均表示短时,但内部成员也有时间长短之分,时量特征相对模糊。通过对时量的考察以及对语义特征的分析,总结出后时连接成分内部成...
关键词:后时连接成分 时量 替换 
CCD语义知识库的构造研究被引量:9
《小型微型计算机系统》2005年第8期1411-1415,共5页刘扬 俞士汶 于江生 
国家"九七三"项目(2004CB318102)资助;国家"八六三"项目(2001AA114210和2002AA117010)资助.
CCD(theChineseConceptDictionary)是一个WordNet框架下的汉英双语语义知识库(theChinese-EnglishWordNet).在制定语义规范后,作者提出了构造CCD的演化模型(themodelofevolution).新的构造模型强调双语语义知识库构造中的继承(inheritan...
关键词:语义分析 语义知识库 概念 双语WordNet CCD 
检索报告 对象比较 聚类工具 使用帮助 返回顶部