张全

作品数:65被引量:142H指数:6
导出分析报告
供职机构:中国科学院声学研究所更多>>
发文主题:HNC理论概念层次网络HNC语义块语句更多>>
发文领域:自动化与计算机技术语言文字文化科学电子电信更多>>
发文期刊:《科研信息化技术与应用》《中国教育网络》《计算机工程与应用》《网络新媒体技术》更多>>
所获基金:国家重点基础研究发展计划中国科学院声学研究所知识创新工程项目中国科学院知识创新工程青年人才领域前沿项目国家科技支撑计划更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
出版产业链技术关系抽取研究
《情报工程》2024年第6期14-27,共14页韦向峰 张全 袁毅 
2023年富媒体数字出版内容组织与知识服务重点实验室开放基金“基于预训练模型的产业技术谱系构建研究”(ZD2023-11/03)。
[目的/意义]出版产业链中技术与产业链环节的关系对于出版产业技术谱系的构建和出版产业的监测具有重要意义。[方法/过程]设计了传统出版和数字出版的产业链环节,并从业务环节、产业术语、技术术语、参与主体、产品服务等维度进行了产...
关键词:出版产业 产业链 关系抽取 关系模板 半监督深度学习 
英汉双语富媒体知识图谱构建工程研究——以CNS英文期刊为例
《情报工程》2023年第5期84-96,共13页韦向峰 缪建明 张全 袁毅 
2022年富媒体数字出版内容组织与知识服务重点实验室开放基金“基于英文科技出版物的跨语言富媒体知识工程研究”(ZD2022-10/01)。
[目的/意义]研究自动构建英汉双语富媒体知识图谱的方法和过程,为跨语言多模态知识图谱的自动构建提供借鉴参考,对及时获取最新英文科研成果、科技情报监测等具有重要意义。[方法/过程]采用自顶向下和自底向上相结合的方法,先从顶层设...
关键词:富媒体 知识图谱 实体抽取 实体对齐 语步识别 
基于端点检测的蒙藏维语音片段数据集被引量:1
《中国科学数据(中英文网络版)》2019年第4期108-118,共11页韦向峰 袁毅 张全 吐尔逊·卡得 
中国科学院信息化专项科学大数据工程(一期),多民族语言资源特色数据库,XXH13505-03-203;中国科学技术信息研究所富媒体数字出版内容组织与知识服务重点实验室开放基金项目,面向语音与文本内容的富媒体关联研究与技术实现;国家社科基金项目,维吾尔语方言语音声学参数库研制,13BYY34
在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语...
关键词:语音片段 端点检测 蒙古语 藏语 维吾尔语 语音数据 
富媒体环境下语音和文本内容的对齐研究被引量:1
《情报工程》2019年第2期17-27,共11页韦向峰 袁毅 张全 池毓焕 
富媒体数字出版内容组织与知识服务重点实验室开放基金项目(ZD2018-07/03):“面向语音与文本内容的富媒体关联研究与技术实现”
语音媒体和文本媒体是富媒体中重要的两种媒体,本文试图解决富媒体内容关联中语音和文本的自动对应和关联问题。本文通过自动语音识别、语音纠错处理、文本相似度计算等技术和方法,把语音和文本的对齐问题转化为文本之间相似和对齐的问...
关键词:富媒体 语音识别 锚点词 编辑距离 最长递增子序列 
基于概念基元的词语相似度计算研究被引量:4
《电子与信息学报》2017年第1期150-158,共9页池哲洁 张全 
国家863计划"十二五"项目(2012AA011102);国家语委"十二五"科研项目(YB125-53)~~
词语相似度的计算在机器翻译、信息检索等多个领域有重要作用。该文以概念层次网络理论的概念基元符号系统为语义资源,在共性与差异性对比思想下,提出一个涵盖层次性、网络性、对比对偶特性、挂靠特性及五元组信息的多维度词语相似度计...
关键词:词语相似度 语义距离 概念层次网络 概念基元 
2015年中国少数民族地区蒙藏维言语录音数据集被引量:2
《中国科学数据(中英文网络版)》2016年第2期62-68,共7页韦向峰 袁毅 张全 池哲洁 
中国科学院信息化专项科技数据资源整合与共享工程重点数据库项目之“民族信息处理学科领域基础科学数据整合与集成应用”
本文介绍了2015年采集的来自内蒙古、青海、西藏和新疆的蒙古语、藏语和维吾尔语言语数据集,使用客户端/服务器架构的言语数据远程采集系统,实现了蒙藏维少数民族言语数据的低成本高效采集,公开共享的言语数据集大小为136 MB近800句。...
关键词:言语数据 少数民族 蒙藏维 录音 远程采集 
基于编辑距离的网页去重策略
《网络新媒体技术》2013年第6期1-7,共7页丁泽亚 张全 
国家高技术研究发展计划(863计划)"十二五"计划项目课题(2012AA011102);国家语委"十二五"科研项目(YB125-53);中国科学院学部咨询项目(Y129091211)
互联网中存在着大量的重复网页,在进行信息检索或大规模网页采集时,网页去重是提高效率的关键之一。本文在研究"指纹"或特征码等网页去重算法的基础上,提出了一种基于编辑距离的网页去重算法,通过计算网页指纹序列的编辑距离得到网页之...
关键词:互联网 网页去重 指纹 编辑距离 
基于HNC概念关联性的领域判定研究被引量:3
《中文信息学报》2013年第6期45-50,共6页池哲洁 张全 
国家高技术研究发展计划(863计划)资助项目(2012AA011102);国家语委“十二五”科研资助项目(YB125-53);中国科学院信息化资助项目;中国科学院声学研究所知识创新工程资助项目(Y154141431)
在概念层次网络理论中,领域是语境单元的一个要素,而领域判定是语境单元萃取的重要课题之一。该文提出一种利用领域概念以及概念关联式进行领域判定的方法,通过在概念基元层面进行频数统计、概念合并及概念汇总实现领域的判定。对政治...
关键词:概念基元 概念关联式 领域判定 
利用概念知识的文本分类被引量:3
《应用科学学报》2013年第2期197-203,共7页丁泽亚 张全 
国家“863”高技术研究发展计划基金(No.2012AA011102);国家语委“十二·五”科研项目基金(No.YB125-53);中科院声学所知识创新工程项目基金(No.Y154141431);中国科学院学部咨询项目基金(No.Y129091211)资助
针对统计方法不能从语义理解的角度进行文本分类的问题,提出了利用概念层次网络概念知识进行文本分类的方法,包括两部分:依据概念进行特征选取以及根据类别关联度分类.在特征选取时,通过计算概念与类别的区分度挖掘出类别核心概念,并采...
关键词:文本分类 概念层次网络 概念 概念区分度 类别关联度 
基于语义块的事件倾向性分析研究被引量:5
《中文信息学报》2012年第3期44-48,共5页韦向峰 张全 缪建明 池毓焕 
国家语委"十二五"科研项目(YB125-53);中国科学院学部咨询项目(Y129091211)
事件的倾向性分析对网络舆情分析和事件趋势分析都具有重要意义。该文把影响倾向性分析的词语分为四类:对象词、褒贬词、逻辑词和程度词,建立了语句倾向性分析的二元模型和三元模型,在语句语义块分析的基础上实现对语句和篇章的倾向性...
关键词:倾向性 语义块 立场分析 
检索报告 对象比较 聚类工具 使用帮助 返回顶部