结构化信息

作品数:176被引量:830H指数:11
导出分析报告
相关领域:自动化与计算机技术更多>>
相关作者:裴京钱龙华徐秋程周国栋严勇杰更多>>
相关机构:北京百度网讯科技有限公司深圳市腾讯计算机系统有限公司浙江大学清华大学更多>>
相关期刊:更多>>
相关基金:国家自然科学基金中央高校基本科研业务费专项资金湖北省自然科学基金国家重点基础研究发展计划更多>>
-

检索结果分析

结果分析中...
选择条件:
  • 机构=苏州大学x
条 记 录,以下是1-7
视图:
排序:
融入结构化信息的端到端中文指代消解被引量:2
《计算机工程》2020年第1期45-51,共7页付健 孔芳 
国家自然科学基金(61876118);国家自然科学基金人工智能基础研究应急管理项目(61751206);国家重点研发计划子课题(2017YFB1002101)
在LEE等人提出的端到端指代消解模型基础上,考虑中文行文特点,提出一种融合结构化信息的中文指代消解模型。压缩文档中所进行有句子对应的成分句法树并获取文档压缩树叶节点深度,采用成分句法树的结构化嵌入(SECT)方法将结构信息进行向...
关键词:端到端指代消解 结构化嵌入 词性 成分句法树 文档句法压缩树 
中文维基百科的实体分类研究被引量:1
《中文信息学报》2015年第5期91-97,124,共8页徐志浩 惠浩添 钱龙华 朱巧明 
国家自然科学基金(61373096;90920004);江苏省高校自然科学研究重大项目(11KJA520003)
维基百科实体分类对自然语言处理和机器学习具有重要的作用。该文采用机器学习的方法对中文维基百科的条目进行实体分类,在利用维基百科页面中半结构化信息和无结构化文本作为基本特征的基础上,结合中文的特点使用扩展特征和语义特征来...
关键词:维基百科 实体分类 半结构化信息 信息框 
基于自监督学习的维基百科家庭关系抽取被引量:1
《计算机应用》2015年第4期1013-1016,1020,共5页朱苏阳 惠浩添 钱龙华 张民 
国家自然科学基金资助项目(61373096;90920004);江苏省高校自然科学研究重大项目(11KJA520003)
传统有监督的关系抽取方法需要大量人工标注的训练语料,而半监督方法则召回率较低,对此提出了一种基于自监督学习来抽取人物家庭关系的方法。该方法首先将中文维基百科的半结构化信息——家庭关系三元组映射到自由文本中,从而自动生成...
关键词:自监督学习 维基百科 半结构化信息 关系抽取 
基于近似随机测试的语义关系抽取比较
《计算机工程》2012年第21期197-201,共5页彭成 钱龙华 赵知纬 周国栋 
国家自然科学基金资助项目(60873150;90920004;61003153);江苏省自然科学基金资助项目(BK2010219)
为比较结构化信息和句法分析器对树核函数的关系抽取的作用,提出一种基于近似随机测试语义关系比较方法。对于2种不同配置关系的抽取结果,采用随机标号互换的方法重复产生样本,通过计算这些样本的性能差异进行显著性分析。实验结果表明...
关键词:关系抽取 树核函数 结构化信息 显著性测试 近似随机测试 
中文名词性谓词语义角色标注的特征研究被引量:3
《计算机应用》2011年第6期1671-1674,1684,共5页徐靖 李军辉 朱巧明 李培峰 
国家自然科学基金资助项目(90920004;60970056;60873150);江苏省自然科学基金资助项目(BK2008160);江苏省高校自然科学重大基础研究项目(08KJA520002)
在语义角色标注中,相对于动词性谓词,名词性谓词与其角色之间的结构更灵活和复杂。为了更好地捕获这些结构化信息,通过对名词性谓词语义角色标注相关特征集的研究,探索了新的单词特征和句法特征,用于名词性谓词语义角色标注。基于正确...
关键词:语义角色标注 特征 动词性谓词 名词性谓词 结构化信息 
结构化信息的去重方法被引量:3
《计算机工程》2009年第3期23-25,28,共4页李林 刘桂峰 赵朋朋 崔志明 
国家自然科学基金资助项目(60673092);2005年度教育部科研基金资助重点项目(205059);2006年江苏省"六大人才高峰"基金资助项目(06-E-037);2006年度江苏省软件和集成电路业专项基金资助项目([2006]221-41);2007年度江苏省研究生创新计划基金资助项目(CX07B-122z)
针对载有结构化信息的网页,提出一种基于学习的去重方法。通过先期准备的样本定义分类器,根据分类器对页面中结构化信息的不同属性字段进行分类和距离计算,计算出整个信息对象和已分类样本信息的距离,以这些距离与阈值的大小关系判断该...
关键词:相似性测度 去重 聚类 
一种结合结构化信息的富文本分类方法
《计算机应用与软件》2008年第6期219-221,共3页朱斐 
随着文本表现形式越来越丰富,文本分类研究的对象正从平文本逐渐转变为富文本,传统的平文本分类方法不能满足实际需要。分析了富文本中的结构化信息和文本内容信息,把它们作为两个重要的因素,综合考虑了其在分类中的作用,提出并实现了...
关键词:文本分类 富文本 OpenDocument 结构化 
检索报告 对象比较 聚类工具 使用帮助 返回顶部