国家自然科学基金(60272055)

作品数:14被引量:98H指数:6
导出分析报告
相关作者:宋柔许勇熊文新罗智勇荀恩东更多>>
相关机构:北京语言大学北京工业大学北京外国语大学上海应用技术学院更多>>
相关期刊:《计算机工程与应用》《计算机研究与发展》《计算机工程》《中文信息学报》更多>>
相关主题:中文信息处理自然语言处理信息检索计算机应用百科全书更多>>
相关领域:自动化与计算机技术文化科学语言文字更多>>
-

检索结果分析

结果分析中...
条 记 录,以下是1-10
视图:
排序:
大学英语作文自动评分中分级词表的效度研究被引量:9
《外语与外语教学》2008年第10期48-52,共5页李艳 葛诗利 
国家自然科学基金课题资助(项目编号:60272055、60572159)
自动作文评分中的核心问题是对高信度的、机器可用的评分特征的选取。大学英语作文自动评分中的一个基本特征是词汇分布,而词汇分布的衡量需要一个描述清晰、刻画准确的大学英语作文分级词表,也就是一个效度较高的词表。实验证明目前...
关键词:自动作文评分 分级词表 效度 大学英语写作 
信息检索技术的发展及其应用被引量:1
《中国科技信息》2008年第10期77-77,79,共2页魏琳 
国家自然科学基金项目(60272055);国家863计划项目(2001AA114111);教育部人文社会科学重点研究基地重大项目(02JAZJD740007);教育部科学技术研究重点项目(00128)
本文主要介绍了几种检索技术,以及它们在搜索引擎中的应用;比较分析了目前各种搜索引擎的优点和不足之处。
关键词:搜索引擎 搜索技术 信息检索 
一种面向构形计算的汉字字形形式化描述方法被引量:7
《中文信息学报》2008年第3期115-123,共9页林民 宋柔 
国家自然科学基金资助项目(60272055,60572159)
目前汉字字形描述方法存在的主要问题是缺少能涵盖一切可能汉字的可计算的字形形式化描述体系,从而造成汉字处理应用中的一系列障碍。本文给出了一种汉字网格字形描述方法,实验表明,该方法具有描述一切可能汉字字形(包括错字)骨架的能力...
关键词:计算机应用 中文信息处理 汉字字形 形式化描述 网格字形 特征计算 
基于半CRF模型的百科全书文本段落划分被引量:2
《北京工业大学学报》2008年第2期204-210,共7页许勇 宋柔 
国家自然科学基金(60272055);国家“八六三”计划资助项目(2001AA114111)
介绍了基于半条件随机域(semi-Markov conditional random fields,简称semi-CRFs)模型的百科全书文本段落划分方法.为了克服单纯的HMM模型和CRF模型的段落类型重复问题,以经过整理的HMM模型状态的后验分布为基本依据,使用了基于词汇语...
关键词:自然语言处理 机器学习 隐马尔科夫模型 文本段落划分 半条件随机域模型 
信息检索需求描述中的词语区域凸显
《计算机科学》2008年第2期181-184,共4页熊文新 宋柔 
国家自然科学基金项目(60272055);国家863项目(2001AA114111);教育部科学技术研究重点资助项目(00128)
根据对当前主流信息检索测试Query的形式和内容分析,通过正则表达式将SGML形式的Query表述区分为不同描述域和主题功能块,针对处于不同区域的词语实施不同的加权策略。实验表明,结合主题词语的区域凸显和TF×IDF的加权方法比单纯TF×ID...
关键词:信息检索 主题词语 凸显 描述域 功能块 
基于CRF的百科全书文本段落划分被引量:3
《计算机工程》2007年第10期16-18,共3页许勇 宋柔 
国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA110372-1)
CRF模型是标注、切分序列数据的较新的概率模型,在信息抽取等文本处理领域广受关注。该文介绍了CRF方法,并将其应用到百科全书文本段落的划分上,利用CRF的特征表述机制加入了文本单元序列中的长距离约束,取得了比传统的隐马尔科夫方法...
关键词:文本段落划分 条件随机域模型 隐马尔科夫模型 
字音转换策略介绍及性能代价评估
《计算机工程与应用》2007年第16期26-29,共4页王洁 宋柔 
国家自然科学基金资助项目(the National Natural Science Foundation of China under Grant No.60272055);教育部科学技术研究重点项目(No.00128);教育部人文社会科学重点研究基地重大项目(No.02JAZJD740007)
许多面向应用的方法研究主要关注的是该方法的技术的性能,而相应的软件开发则要顾及整个系统的性能代价比,即不但要考虑到技术的性能,还要考虑到系统开发过程中的人力投入以及系统实现运行时的存储占用等方面的因素。这就对学术研究提...
关键词:字音转换 准确率 性能 代价 
信息检索用户查询语句的停用词过滤被引量:16
《计算机工程》2007年第6期195-197,共3页熊文新 宋柔 
国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA114111);教育部科学技术研究资助重点项目(00128);教育部人文社会科学重点研究基地资助重大项目(02JAZJD740007)
针对以自然语言形式提出的查询请求,区分信息需求表述和信息内容两部分。基于近20万语句的查询语料库和背景语料人民日报对照,提出汉语通用停用词和查询专用的相对停用词,采用左右熵和Ngram方法及KL距离脱机构造相应候选词表。根据候选...
关键词:用户查询 停用词 构造 识别 
基于SLM的二叉树在语音停顿预测中的应用被引量:2
《计算机工程》2006年第19期23-25,28,共4页钱揖丽 荀恩东 宋柔 
国家自然科学基金资助项目(60272055);国家"863"计划基金资助项目(2001AA114111);教育部科学技术研究重点基金资助项目(00128)
讨论基于统计语言模型SLM(Statistic Language Model)的二叉树在语音停顿预测中的应用。基于大规模语料,利用三元模型Trigram,建立统计语言模型;基于SLM为待处理句子生成相应的二叉树;将生成的二叉树所包含的信息,从不同角度应用于语音...
关键词:统计语言模型 二叉树 语音停顿 预测 
信息检索自然语言查询问句处理框架被引量:3
《计算机科学》2006年第10期144-147,204,共5页熊文新 宋柔 
国家自然科学基金资助项目(60272055);国家863计划资助项目(2001AA114111);教育部科学技术研究重点资助项目(00128)。
以自然语言形式提出的查询问句不同于通常的关键词或主题词查询,需要提取用户真正要检索的信息内容。该文提出一个自然语言查询语句的处理框架,由3个部分构成:(1)离析查询问句的操作表述和信息内容;(2)凸显真正的信息需求内容;(3)对不...
关键词:信息检索 查询请求 查询表述 
检索报告 对象比较 聚类工具 使用帮助 返回顶部