中文信息处理

作品数:1719被引量:10131H指数:48
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:刘挺孙茂松郑家恒吴健俞士汶更多>>
相关机构:清华大学北京大学中国科学院山西大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程x
条 记 录,以下是1-10
视图:
排序:
基于情绪知识的中文微博情感分类方法被引量:32
《计算机工程》2012年第13期156-158,162,共4页庞磊 李寿山 周国栋 
国家自然科学基金资助项目(61003155;60873150)
通过对新浪微博文本进行情感信息方面的分析与研究,提出一种基于情绪知识的非监督情感分类方法。利用情绪词和表情图片2种情绪知识对大规模微博非标注语料进行筛选并自动标注,用自动标注好的语料作为训练集构建微博情感文本分类器,对微...
关键词:中文信息处理 无监督学习 情绪知识 微博 情感分类 
基于状态和行为描述的情感分类方法
《计算机工程》2012年第8期147-149,152,共4页张慧 王中卿 李寿山 杨欣欣 李培峰 朱巧明 
国家自然科学基金资助项目(60970056;61070123;61003155);模式识别国家重点实验室开放课题基金资助项目;江苏省自然科学基金资助项目(BK2008160);高等学校博士学科点专项科研基金资助项目(20093201110006)
为利用情感文本不同侧面的信息,提出一种基于状态和行为描述的情感分类方法。将情感文本的描述分为情感的状态和行为2个视图,并利用2个视图的融合进行情感分类。为自动获得2个视图,人工标注了相应的语料,通过二元分类器构建状态和行为...
关键词:中文信息处理 情感分析 监督学习 最大熵 分类器融合 
水族文字笔形编码方法研究被引量:3
《计算机工程》2011年第14期285-287,共3页杨撼岳 陈笑蓉 郑高山 
贵州省科学技术基金资助项目"水族文字键盘输入系统研究"(黔科合J字[2010]2093号)
针对水族文字不易编码的问题,提出一种基于笔形特征的编码方法。分析《水书常用字典》收录的467个水族文字的字形特征,总结出7种基本笔画。通过统计比较,将7种基本笔画按几何形状细分重组为21类笔形。依据编码规则,取水族文字3个角的笔...
关键词:中文信息处理 水族文字 笔形 编码 输入法 
基于语料库的藏文字属性分析系统设计被引量:10
《计算机工程》2011年第22期270-272,共3页才智杰 才让卓玛 
国家自然科学基金资助项目(61163018);国家"973"计划前期研究专项基金资助项目(2010CB334708);国家社会科学基金资助项目(09XYY024);青海省科技厅应用基础研究计划基金资助项目(2011-Z-755);青海师范大学科研创新计划基金资助项目;青海师范大学中青年科研基金资助项目
通过对藏语语料库的统计和现代藏文字结构的分析,研究现代藏文字属性分析系统的模型,设计基本构件字表库、组合构件字表库、粗粒度结构字表库及细粒度结构字表库,并阐述各字表库的结构特征,介绍藏文字属性分析算法。运用该算法及藏文字...
关键词:中文信息处理 属性 构件 字结构 
面向语音转换的汉语语料自动选取算法
《计算机工程》2011年第5期256-257,260,共3页沈亚敏 赵晖 张权 唐朝京 
国家部委基金资助项目
为实现语音转换,建立符合要求的汉语语音转换语料库,提出一种基于半音节模型的语料自动选取算法。根据语音转换训练时需要语料数量较少的特征,选择半音节作为语料库的基本单位。在此基础上,从原始语料中自动选取语料,根据语音转换对说...
关键词:中文信息处理 语音库 语音转换 覆盖率 
手写汉语拼音的融合识别系统被引量:1
《计算机工程》2010年第7期170-172,共3页朱萌 刘长松 陈御天 邹燕明 
国家"973"计划基金资助项目(2007CB311004);国家自然科学基金资助项目(60772049)
手写设备用户容易忘记特定中文单字写法,需要为其提供拼音输入法。采用分类器融合方式构筑拼音单词识别系统,通过隐马尔可夫模型分类器获得拼音单词的切分点,利用统计特征识别模块进行识别后融合,研究并改进拼音单词基线提取方法。实验...
关键词:中文信息处理 字符识别 基线 
中文文本体裁分类中特征选择的研究被引量:8
《计算机工程》2008年第23期89-91,共3页邓琦 苏一丹 曹波 闭剑婷 
国家自然科学基金资助项目(60564001)
针对文本体裁自动分类在特征选择和权重计算方面的特殊性,提出文本的内容类别信息,改进传统特征选择方法CHI以及权重计算公式tf.idf,并运用支持向量机在含5类体裁的语料上进行中文文本体裁自动分类。实验结果表明,该方案是可行的。
关键词:中文信息处理 体裁分类 特征项选择 支持向量机 
自动提取含字母词语的领域新术语的研究被引量:3
《计算机工程》2007年第2期47-49,共3页姜韶华 党延忠 
国家自然科学基金资助项目(70271046)
新术语的提取是中文信息处理领域的一个重要研究课题。针对现有提取方法的不足和很多专业术语表现为字母词语的特点,该文提出了一种综合统计技术和规则筛选的方法:基于长串优先和串频统计的思路进行文本切分,得到共现字符串,利用词语搭...
关键词:专指语义串 长串优先 字母词语 中文信息处理 
基于交叉覆盖算法的中文文本分类被引量:8
《计算机工程》2006年第19期183-184,共2页刘政怡 龚建成 吴建国 
安徽省高校青年教师科研资助计划项目(2005JQ1038)
基于向量空间模型的文本分类过程中遇到的最大问题就是以词为特征项的向量维数太大,需要进行特征选取,而交叉覆盖算法的输入集是n维欧式空间的点集,可以忽略维数的大小,从而最大程度上精确地表示文本,然后再进行分类,能够大大提高正确...
关键词:文本分类 交叉覆盖算法 中文信息处理 
主题新闻信息门户系统的设计与实现被引量:5
《计算机工程》2006年第10期265-267,共3页莫倩 刘书家 
介绍了一个将主题追踪技术与信息门户技术相结合,实现个性化服务的主题新闻信息门户系统。系统能够根据用户设定的不同主题新闻策略,动态监测互联网新闻信息源,自动采集相关网站新闻信息,对相关主题进行实时动态追踪。描述了主题新闻信...
关键词:主题追踪 信息门户 中文信息处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部