钱小飞

作品数:22被引量:63H指数:3
导出分析报告
供职机构:上海大学文学院更多>>
发文主题:名词短语汉语现代汉语图像复杂度句法分析更多>>
发文领域:语言文字自动化与计算机技术文化科学电子电信更多>>
发文期刊:《语文学刊》《枣庄学院学报》《中文信息学报》《语言文字应用》更多>>
所获基金:国家高技术研究发展计划上海市哲学社会科学规划课题国家语委科研项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
语言数据资源建设中的关键问题及对策被引量:3
《语料库语言学》2021年第2期94-105,共12页钱小飞 
国家语委“十三五”科研规划一般项目“中国语言信息化政策研究文献数据库建设”(YB135-98)资助
语言数据资源包括语料库和语言知识库,是语言服务和语言信息处理的重要支撑。本文分析了我国语言数据资源建设中存在的质量问题、发展不平衡问题、规范与评价问题、版权与共享问题,以及学科建设问题,并从理论建设、项目规划、管理与支...
关键词:语言数据资源 建设 宏观问题 发展建议 
基于预制约束的汉语语音录入系统
《现代语文》2021年第12期59-64,共6页钱小飞 
国家语委“十三五”科研规划项目“中国语言信息化政策研究文献数据库建设”(YB135-98)。
基于预制约束,提出一种汉语语音录入的解决方案。在软件系统方面,通过定制音系系统,采用大颗粒度语音数据和选择式录入方式进行语音录入,并引入智能的错误检查机制和记忆排序机制,来检测错误和提高录入效率。在管理系统方面,重视录入流...
关键词:汉语语音录入 预制 约束 流程管理 
中国语言文字信息化的发展
《语文学刊》2021年第6期29-34,共6页钱小飞 
国家语委科研项目“中国语言信息化政策研究文献数据库建设”(YB135-98)资助项目成果之一。
通过分析我国语言文字信息化工作的意义、发展内容和历史,将中国的语言信息化过程分为科技发展统一规划期、管理工作探索期和系统规划推进期,指出目前我国语言信息化发展存在包括理论基础薄弱、语言资源建设不足、民族语言文字信息化发...
关键词:语言文字信息化 发展内容 发展过程 
基于词汇移植和构式特征的“好不+X”构式识别
《语言文字应用》2021年第3期133-143,共11页钱小飞 
本文认为"好不+X"构式中变项X具有高量属性,通过类比"好不X"格式与"高量级程度副词+(不)+X"结构,提出基于词汇移植的无监督识别方法,取得了95.87%的正确率和89.72%的召回率,并挖掘"好不+X"的构式特征,构造了基于构式特征的方法改进识别...
关键词:“好不+X”构式 识别 词汇移植 构式特征 
面向汉语国际教育的实词搭配知识库建设被引量:6
《语言文字应用》2020年第4期132-142,共11页钱小飞 
上海市哲社青年课题“面向汉语国际教育的词语搭配知识库”(2013EYY005)资助。
汉语国际教育所需要的词语搭配是组块性搭配,频率效应、母语经验是教学和习得需要考虑的重要因素,可视、互动的词语组合网络有助于构建学生的内部词汇网络。本文提出由语法属性、线性属性、共现属性、翻译属性、教学功能属性等5种属性...
关键词:实词搭配 知识库 属性描写 搭配网络 可视化 
汉语内层最长名词短语的识别研究
《浙江外国语学院学报》2019年第6期59-67,共9页钱小飞 
汉语名词短语的内部结构复杂,找出名词短语内部嵌套的最长名词性成分,有助于消解底层句法歧义,挖掘论元结构和语义关系。文章分析了汉语内层最长名词短语的多层级分布特征,指出数据稀疏、结构歧义和边界歧义是识别的难点,并提出了一种...
关键词:内层最长名词短语 识别 条件随机场 基本名词块提升 
组块分析研究综述被引量:3
《现代语文》2018年第6期166-170,共5页钱小飞 
组块分析是一种新的句法分析思路和策略,侧重于解决底层歧义问题。文章归纳分析了组块分析的不同任务和研究方法,指出统计和规则方法相结合常常能取得更好的效果,但基本名词短语,最长名词短语等相对较大的语块的识别效果仍然不能令人满...
关键词:组块 句法分析 综述 
汉语最长名词短语的结构复杂性研究被引量:1
《语料库语言学》2017年第1期20-30,100,共12页钱小飞 侯敏 
上海市青年教师培养资助计划“汉语最长名词短语识别方法研究”(shu11053);国家语言资源监测与研究中心科研项目“面向浅层句法分析的最长NP研究”(YZYS08-04)资助
文章从结构的视角界定了汉语最长名词短语(MNP)的复杂性概念,提出以内部结构的分布倾向性和结构标记性两个指标作为判断复杂结构的依据,将最长名词短语分为简单MNP和复杂MNP。复杂MNP包括了有标记和无标记两种情况,其中有标记的复杂MNP...
关键词:最长名词短语 复杂性 结构 识别难点 
面向信息处理的汉语最长名词短语界定研究被引量:3
《语言文字应用》2017年第2期127-134,共8页钱小飞 侯敏 
国家语言资源监测与研究中心项目"面向浅层句法分析的最长NP研究"(编号:YZYS08-04)的研究成果
目前广泛采纳的最长名词短语定义是以其句法功能划分出的短语子集,导致了近30%的边界识别错误,同时由于对基本特征缺乏一致认识,不同研究的定义结果也有所不同。本文讨论了最长名词短语的长度约束、名词性认定、外延范围和层次构造等问...
关键词:中文信息处理 最长名词短语 界定 句法位置 全集 
论娱乐类短信的模仿性特征
《枣庄学院学报》2017年第3期58-61,共4页钱小飞 
短信的模仿性特征表现为变异式复制、形式模拟、格式填充、语义结构仿创、引用式语境模拟等形式,对建构短信的娱乐特征、促进短信传播发挥了重要作用,同时,也带来了低俗语言大量传播的问题。使用不同的模仿手法的短信内容格局不同,语义...
关键词:短信 娱乐 模仿性 
检索报告 对象比较 聚类工具 使用帮助 返回顶部