中文信息处理

作品数:1719被引量:10131H指数:48
导出分析报告
相关领域:自动化与计算机技术语言文字更多>>
相关作者:刘挺孙茂松郑家恒吴健俞士汶更多>>
相关机构:清华大学北京大学中国科学院山西大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金国家高技术研究发展计划国家重点基础研究发展计划国家社会科学基金更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 期刊=计算机科学x
条 记 录,以下是1-10
视图:
排序:
基于专利结构的中文专利摘要研究被引量:3
《计算机科学》2020年第S01期45-48,共4页束云峰 王中卿 
国家自然科学基金(61806137,61702518)。
任务旨在通过对原文进行压缩提炼,得出简明扼要的内容描述。针对中文专利文本,提出了一种基于Patent-Rank算法生成专利摘要的算法。首先,对候选句群做冗余处理,以去除候选句群中相似度较高的句子;然后,对专利中的权利要求书和说明书构建...
关键词:文本摘要 专利 相似度计算 中文信息处理 PatentRank 
自然语言处理技术在社会传播学中的应用研究和前景展望被引量:22
《计算机科学》2020年第6期184-193,共10页吴小坤 赵甜芳 
国家重点研发计划项目(2017YFC0820106);国家社会科学基金重点项目(18AXW007);国家自然科学基金面上项目(61873097,61972442)。
作为人工智能领域的重要研究方向之一,自然语言处理技术(Natural Language Processing,NLP)极大地促进了社会传播学的发展。文中在梳理国内外NLP发展脉络的基础上,综述了其在社会传播学领域内假新闻检测、常识推理、自动化新闻理解和生...
关键词:自然语言处理 中文信息处理 社会传播 新闻传播 传播分析 
专家寄语
《计算机科学》2015年第5期F0002-F0002,共1页于剑 
随着大数据时代的到来,数据挖掘迎来了自己的黄金时代。各行各业都已经积累了大量数据,急需从中即提取或“挖掘”出有用的潜在知识,为相关行业和学科提供更加科学合理的服务。由此,数据挖掘吸引了越来越多不同领域的研究学者,涉及...
关键词:数据挖掘 专家 中文信息处理 浙江师范大学 学术会议 生物信息学 科学合理 机器学习 
中文微博命名实体识别被引量:33
《计算机科学》2013年第6期196-198,共3页邱泉清 苗夺谦 张志飞 
国家自然科学基金项目(60970061,61075056,61103067);中央高校基本科研业务费专项资金资助项目资助
微博这一媒体形式的迅速发展为命名实体识别提供了一个新的载体。根据微博文本的特点,提出针对中文微博的命名实体识别方法。首先,对微博文本做规范化处理,消除由于微博表达不规范造成的干扰;在建立中文人名库、常用地点库等知识库的基...
关键词:中文信息处理 微博 命名实体 条件随机场 
基于微博的股票投资者未来情感倾向识别研究被引量:3
《计算机科学》2012年第B06期249-252,共4页庞磊 李寿山 张慧 周国栋 
国家自然科学基金项目(61003155;90920004)资助
近年来,微博越来越受到网络用户的青睐,成千上万的用户通过发布微博共享他们的观点和情感。其中,有大量带有情感倾向(认为某事物"好"或"坏")的微博,这些微博反映了作者的情绪。投资者情绪(investor sentiment)是研究经济市场走向的重要...
关键词:计算机应用 中文信息处理 投资者情绪 微博 情感分类 情感倾向 
一种基于词编码的中文文档格式被引量:1
《计算机科学》2008年第10期162-164,共3页焦慧 刘迁 贾惠波 
分析了汉语自动分词问题产生的根源和面临的困难,针对性地提出了一种基于词的中文编码方法和中文文档新格式,实现了以词作为中文文本的最小信息载体,使中文文本分析可以在词平台上实现,避免了自动分词对中文信息处理带来的障碍。基于中...
关键词:中文信息处理 词典码 文档格式 自动分词 
一种基于隐含子类信息的粗糙集中文文本分类方法被引量:1
《计算机科学》2008年第2期147-149,共3页金凯民 苗夺谦 段其国 
2006年博士学科点专项科研基金(20060247039);国家自然科学基金(60475019)的资助
中文文本分类是中文信息检索和Web挖掘等领域的研究热点。现有的一些分类方法在特征选择阶段存在不足,忽略了隐含的子类信息。本文提出了一种提升隐含子类的关键词权值的方法,从而可以发现有价值的子类信息,进而使用粗糙集构建分类器。...
关键词:中文信息处理 粗糙集 文本分类 向量空间模型 
基于Web语料的概念获取系统的研究与实现被引量:6
《计算机科学》2007年第2期161-165,195,共6页余蕾 曹存根 
自然科学基金(#60273019;60573064;60573063和60496326);国家重点基础研究发展计划(2003CB317008和G1999032701)资助
互联网网页中存在大量的专业知识。如何从这些资源中获取知识已经成为10多年来的一个重要的研究课题。概念和概念间的关系是知识的基本组成部分,因此如何获取并验证概念,成为从文本到知识的过程中的重要步骤。本文提出并实现了一种自动...
关键词:中文信息处理 知识获取 概念获取 概念验证 
汉语句间成分共享类型及分布研究被引量:2
《计算机科学》2007年第1期166-169,共4页张全 吴晨 韦向峰 
国家973项目"自然语言理解的交互引擎研究"(2004CB318104);中科院声学所知识创新工程项目"HNC语言知识处理理论及技术"的资助
自然语言中语句之间经常出现句子成分共享的情况。本文以计算语言学理论为指导,首先明确了便于计算机自动处理的句子和句群的定义。以此为基础,获得了真实语料中句群单位内相关数据的统计结果。进而依据语句的定义分析了语句之间语义块...
关键词:中文信息处理 自然语言理解 语句分析 句群分析 语义块共享 
HNC问答处理系统关键算法研究
《计算机科学》2006年第6期200-202,217,共4页吴晨 张全 
国家973项目"自然语言理解的交互引擎研究"(2004CB318104);中科院声学所知识创新工程"语言知识处理理论及技术"的资助。
HNC问答处理系统是一种崭新的问答处理模式,与传统的问答处理系统相比,它把对语言的处理深入到语言概念空间中进行,以求尽可能地减少语言中的同义和多义模糊。本文在介绍HNC问答处理系统整体构架的同时,设计和实现了问答系统中的3个关...
关键词:中文信息处理 问答系统 语言概念空间 语义相关度 HNC理论 
检索报告 对象比较 聚类工具 使用帮助 返回顶部