中文信息处理

作品数:1719被引量:10131H指数:48
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:刘挺孙茂松郑家恒吴健俞士汶更多>>
相关机构:清华大学北京大学中国科学院山西大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机工程与应用x
条 记 录,以下是1-10
视图:
排序:
复句关系词自动识别中规则的表示方法研究被引量:8
《计算机工程与应用》2016年第1期127-132,共6页胡金柱 舒江波 胡泉 李源 杨进才 谢芳 
国家社科基金(No.11BYY052);国家社科青年基金(No.13CYY037);国家自然科学基金(No.61177063);教育部社科规划基金(No.13YJAZH11)
关系词在现代汉语复句领域起着重要的作用,是汉语语法、语义研究中的重要内容,复句关系词的计算机自动识别是一个非常困难的研究课题。在汉语复句关系词自动识别中规则的约束条件研究的基础上,重点研究现代汉语复句关系词自动识别系统...
关键词:汉语复句关系词 规则的表示方法 自动识别 中文信息处理 
网页在线评论情感倾向的直觉模糊分类被引量:2
《计算机工程与应用》2013年第1期148-151,共4页王海 冯向前 钱钢 
江苏省高校自然科学研究项目(No.11KJD630001)
网页在线评论的情感分类关系到个人决策、企业管理甚至社会安全。提出了一种基于直觉模糊推理的情感分类方法,通过样本库的学习将特征在分类时的不确定性分别用隶属度、非隶属度、犹豫度定量地描述,同时定量地考虑程度副词、转折词、否...
关键词:中文信息处理 文本分类 情感分类 直觉模糊集 
一种基于扩展的两步文本倾向性分析方法被引量:4
《计算机工程与应用》2012年第1期162-165,169,共5页樊兴华 王鹏 周鹏 
国家自然科学基金(No.60703010);重庆市教委科学技术研究项目(No.KJ070519)
提出一种基于扩展的两步文本倾向性分析方法,该方法利用包含倾向性词表、否定词表、程度词表在内的情感词语对训练文本进行特征扩展,按照将情感词语和内容词语是否同等对待来构造两个分类器CF1和CF2;在分类时,对测试文本进行和训练文本...
关键词:中文信息处理 特征扩展 倾向性分析 构造分类器 
现代汉语“V+N”序列关系的平行处理被引量:1
《计算机工程与应用》2010年第30期8-10,共3页冯敏萱 
国家社会科学基金项目(No.07BYY050);国家社会科学青年基金项目(No.10CYY021);江苏省哲学社会科学基金一般项目(No.10YYB007);南京师范大学"211工程"三期重点学科建设项目;南京师范大学特聘教授;高层次人才科研启动基金项目(No.184070H2A96)
目前,在英汉平行语料中,对汉语文本的深加工多局限于只利用单语分析的成果,没有充分利用双语资源。以现代汉语v+n序列的结构关系为研究对象,设计出在英汉平行语料中识别v+n结构关系的平行处理算法:首先利用各种单语资源,提取出构成不同...
关键词:平行语料 词语搭配 短语分析 自动识别 中文信息处理 
基于概念图的中文信息自动转化技术研究被引量:3
《计算机工程与应用》2008年第15期151-154,共4页刘岩 张蕾 
陕西省教育厅专项科研基金资助项目(No.HD0130)
概念图是一种基于语言学、心理学、哲学为一体的一种知识表示方法,目前主要应用于自然语言处理、知识获取、规划及推理等方面。在哈工大IR-Lab资源基础之上,并结合《知网》的世界知识信息,基于概念图理论提出了一种中文文本信息自动转...
关键词:计算机应用 概念图 中文信息处理 知网 文本理解 句法分析 
单数组全映射分词词典被引量:4
《计算机工程与应用》2007年第23期184-186,共3页魏进 常朝稳 
公安部金盾工程资助项目
通过研究和分析目前几种典型的分词词典机制:整词二分、TRIE索引树、逐字二分及双字哈希,提出并实现了新的单数组全映射(SAFM)分词词典。该词典具有构造简单,分词速度快,占用空间小的优点。
关键词:中文信息处理 汉语自动分词 汉语自动分词词典机制 单数组全映射 
基于FFT的网页正文提取算法研究与实现被引量:15
《计算机工程与应用》2007年第30期148-151,共4页李蕾 王劲林 白鹤 胡晶晶 
国家发改委CNGI示范工程资助项目(No.CNGI-04-15-2A)
主要研究"正文式"网页的有效信息提取算法。该种底层网页真正含有Web页面所表达的主题信息,通常包含一大段的正文信息,正文信息的前后是一些格式信息(例如导航信息、交互信息、JavaScript脚本等)。分析了此种网页的页面结构特征,将问题...
关键词:中文信息处理 WEB页面 信息提取 页面结构 FFT 区域分割 
汉语句子谓词的自动识别方法研究被引量:1
《计算机工程与应用》2007年第17期176-178,共3页谌志群 
浙江省自然科学基金(the Natural Science Foundation of Zhejiang Province of China under Grant No.M603025)
谓词的自动识别是浅层句法分析的重要内容。以汉语的“谓词中枢论”为语言学基础,详细分析了汉语句子中谓词所处的上下文环境,讨论了影响谓词出现的主要语境因素。提出了一种基于统计学原理的汉语句子谓词自动识别概率模型,通过极大似...
关键词:中文信息处理 浅层句法分析 谓词识别 概率模型 折扣模型 
Web新闻语料分词和标注错误分析被引量:4
《计算机工程与应用》2007年第15期166-169,共4页张永奎 张彦 安增波 刘睿 
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60475022) ;山西省自然科学基金(the Natural Science Foundation of Shanxi Province of China under Grant No.20041041);山西省回国留学人员基金(No.2002004)。
通过分析Web突发事件语料库文本的加工统计得出11类错误类型,并对其中的一些错误提出了解决方案。研究结果不仅对语料库加工初期分词、标注方法的改进有启发作用,而且对中文的自动校对方法,提供一定的借鉴。
关键词:中文信息处理 分词 词性标注 错误类型 Web突发事件新闻语料库 
汉语分词词典设计被引量:11
《计算机工程与应用》2007年第1期1-2,26,共3页翟伟斌 周振柳 蒋卓明 许榕生 
国家自然科学基金资助项目(70471064)。
汉语分词词典是中文信息处理系统的重要基础,词典算法设计的优劣直接关系着分词的速度和效率。论文采用动态TRIE索引树的词典机制,设计并实现了汉语分词词典,有效地减少了词典空间。实验结果表明该词典具有较高的查询性能。
关键词:汉语分词 词典查询 中文信息处理 
检索报告 对象比较 聚类工具 使用帮助 返回顶部