中文信息处理

作品数:1720被引量:10139H指数:48
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:刘挺孙茂松郑家恒吴健俞士汶更多>>
相关机构:清华大学北京大学中国科学院山西大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 主题=分词x
条 记 录,以下是1-10
视图:
排序:
中文信息处理的现状与未来展望
《文化产业》2023年第31期37-39,共3页解全颖 
党的十九大上,“文化自信”第一次被正式写进《中国共产党章程》。在向第二个百年奋斗目标迈进的时代背景下,在弘扬中华优秀传统文化,坚定文化自信的征程中,随着我国信息产业的快速发展,中文信息处理变得越来越重要。其中,汉语分词技术...
关键词:中文信息处理 机器学习 汉语分词 信息提取技术 信息产业 语义分析技术 党的十九大 文本分析 
面向新时代的人民日报语料中文分词歧义分析被引量:3
《情报科学》2021年第11期103-109,共7页彭秋茹 王东波 黄水清 
【目的/意义】对近几年的人民日报语料中文分词结果进行统计和分析有利于总结新时代的中文语料在分词歧义方面的规律,提高分词效果,促进中文信息处理的相关研究和技术的发展。【方法/过程】本文以2015年以后的共4个月新时代的人民日报...
关键词:中文分词 分词歧义 新时代人民日报分词语料 切分变异 中文信息处理 
中文信息处理中的自动分词方法研究被引量:9
《现代交际》2019年第7期93-95,共3页杨涛 
教育部人文社会科学研究青年基金项目"基于眼动法的中文分词机制研究"(17YJC740107)
自动分词技术是中文信息处理的入门技术。通过对现有的三类中文分词算法(即基于词典的分词方法、基于统计的分词方法和基于理解的分词方法)的回顾和评述,分析"词"的界定、歧义消除和未登录词识别等制约中文分词的三大瓶颈,为中文分词技...
关键词:中文分词 分词算法 歧义消除 未登录词 
中文信息处理中自动分词技术的研究与展望
《科技创新与应用》2015年第25期106-106,共1页郭淑妮 
当前人们在工作和学习中需使用中文信息处理技术获取自己需要的资源,基于人们需求不断增加,必须提升人们搜索资源的效率,提升中文信息处理相关技术,让中文信息处理与时俱进,满足人们实际需求。中文信息处理包含多种关键技术,为提高信息...
关键词:中文信息处理技术 自动分词技术 研究 
蒙古族人名译名的自动识别研究
《内蒙古工业大学学报(自然科学版)》2015年第3期214-217,共4页贺慧 
国家自然科学基金资助项目(批准号:61363052);内蒙古工业大学科学研究项目(ZS201005)
蒙古族人名译名的自动识别对汉语自动分词的研究具有重要意义。本文提出了一种在中文文本中自动识别蒙古族人名译名的算法。以蒙古族人名译名用字信息为基础,利用译名首尾字表、称谓词表和指界动词表对候选译名再定界,并针对译名特点采...
关键词:蒙古族人名译名 译名自动识别 汉语分词 中文信息处理 
基于最小费用最大流的中文分词算法模型
《科技资讯》2014年第26期219-219,共1页马凌霄 
中文自动分词不仅是中文信息处理的基础性工作而且对后续句法分析、语义分析等中文信息处理流程有着很大的影响。本文基于最小费用最大流,提出一个具有拓展性的中文分词算法模型,实验证明了本算法能够准确地对输入文字串进行切分。
关键词:中文分词 最小费用最大流 字符串匹配 中文信息处理 
中文搜索引擎中的中文信息处理技术探究
《中国电子商务》2014年第18期86-86,共1页赵丽 
山西省自然科学基金项目(2013011017-2)
随着Intemet规模的不断增长,互联网上信息资源也快速膨胀起来.网络资源的扩大和其具有的异构性、开放型和分布性有着直接的关系,但是用户想在网络上准确、快速的得到信息变得更加困难,而中文搜索引擎的出现转变了这种状况.本文分析了中...
关键词:中文搜索引擎 中文信息处理 HIML文档 分词技术 
基于改进Trie树结构的正向最大匹配算法被引量:11
《计算机应用与软件》2014年第5期276-278,共3页熊志斌 朱剑锋 
海南省教育厅基金项目(Hjkj201137);三亚市院地合作项目(2011YD19)
提出一种改进的Trie树结构,树节点记录了字符串与构词的位置信息,子节点采用哈希查找机制,在此基础上优化了中文分词的正向最大匹配算法。分词过程中利用自动机机制判断是否构成最长词,解决了正向最大匹配算法需要根据词长调整字符串的...
关键词:中文信息处理 分词 正向最大匹配算法 
基于组合型中文分词技术的改进被引量:2
《南京邮电大学学报(自然科学版)》2013年第6期112-117,共6页梁胜 成卫青 
国家自然科学基金(61170322;71171117);江苏省自然科学基金(BK2010524)资助项目
在分词过程中如何处理歧义切分是中文分词算法要解决的难点之一。文中提出了一种改进的基于词典和基于统计的组合中文分词算法,能够发现并处理交集型歧义,该算法在发现歧义的过程中没有采取传统的双向匹配法而是采用双栈的结构,减少了...
关键词:中文信息处理 组合型分词 交集型歧义 
网页特征描述算法探讨
《电子制作》2013年第6X期78-78,共1页杨柳 
基于WEB个性化服务的主要目的是根据用户访问过并且感兴趣的网页进行准确描述,以满足用户对针对性、可定制性、主动性、智能性服务的要求。本文从网页特征描述中涉及到的个性化词典引入、网页特征词权重改进计算两个方面进行分析研究,...
关键词:中文信息处理 特征抽取 分词词典 权重计算 个性化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部