邹嘉彦

作品数:18被引量:387H指数:9
导出分析报告
供职机构:香港城市大学更多>>
发文主题:汉语自动分词汉语中文信息处理新词语料库更多>>
发文领域:自动化与计算机技术语言文字文化科学更多>>
发文期刊:《计算机工程与应用》《语言研究》《民族语文》《方言》更多>>
所获基金:国家自然科学基金国家重点基础研究发展计划香港特区政府研究资助局资助项目教育部科学技术研究重点项目更多>>
-

检索结果分析

署名顺序

  • 全部
  • 第一作者
结果分析中...
条 记 录,以下是1-10
视图:
排序:
从大数据库比较港沪两地“车”和“笔”类词的衍生和发展被引量:1
《语言研究》2021年第4期12-25,共14页邹嘉彦 游汝杰 
近50年来,因社会环境和语言政策不同,港沪两地的语言呈现出不同的发展趋势。本文着重探讨两地语言的四个具体课题:(1)核心词的门槛,(2)文化词汇"车"和"笔"类词,(3)不同地区语言的互懂度,(4)语言和文化对比和对称情况。词汇量与阅读能力...
关键词:词汇发展 新词衍生 社会语言学 文化语言学 交通工具 书写工具 核心词 阅读门槛 词频 
汉语共时语料库与追踪语料库:语料库语言学的新方向被引量:7
《中文信息学报》2011年第6期38-45,共8页邹嘉彦 邝蔼儿 路斌 蔡永富 
香港研究资助局优配研究基金(9040092;9040386;149607)
随着信息技术的不断提升、互联网的普及,汉语自然语言处理的难题不断得到解决,汉语语料库的发展和语料库语言学的应用也面临着新的契机。如何持续充分应用庞大的多种语料库,并协同与配合语言学和人文、社会科学多个领域,来追踪了解各种...
关键词:语料库语言学 LIVAC汉语语料库 共时语料库 追踪语料库 
粤语“阳入对转”词的底层来源被引量:3
《民族语文》2008年第4期51-60,共10页郭必之 钱志安 邹嘉彦 
“A Comparative Study of 10 Peripheral Yue Dialects:Contribution to Chinese Linguistics”计划(由香港特区政府研究资助基金赞助,编号:CityU 144507/07,主持人:郭必之)的阶段性成果.
早期壮侗语和苗瑶语,因方言的差异,一些词的辅音韵尾变为相应的鼻音韵尾(或相反)。粤语有一批具"阳入对转"关系的词语,可能与壮侗、苗瑶底层有关。
关键词:粤语 苗瑶语 壮侗语 韵尾 方言 鼻音 辅音 词语 
汉语新词与流行语的采录和界定被引量:24
《语言研究》2008年第2期53-61,共9页邹嘉彦 游汝杰 
新词和流行语是语言研究的一个热点。新词的采录和界定,应该以具有连续性和惯常性的语料库作基础,因为它具有时间、空间、频量的依据,可大大提高研究成果的科学性和准确性。采录新词时,则应注意其地区性、时间性、广用性、频用性和稳定...
关键词:新词 流行语 词典 
《21世纪华语新词语词典》编纂感言被引量:1
《辞书研究》2007年第6期123-128,共6页邹嘉彦 游汝杰 
华语文及其背后的中华文化,历史悠久,千姿百态,涉及的地域辽阔,人口众多。受不同文化背景和政治实体的影响,各地域间在相当长一段时期内交流较少,因此渐渐形成了各具特色的华语文地域变体。近三十年来,随着社会的发展,经济和文...
关键词:新词语 词典 华语 社会语言学 地域变体 编纂 改革开放政策 中华文化 
海南省三亚市迈话音系被引量:7
《方言》2007年第1期23-34,共12页江荻 欧阳觉亚 邹嘉彦 
海南省三亚市迈话有些特点与粤语、客家话相近,但尚不容易判定它属于哪种方言。本文描写了迈话的声韵调系统,并列出了同音字汇。
关键词:海南三亚迈话 声韵调系统 同音字汇 
基于无指导学习策略的无词表条件下的汉语自动分词被引量:37
《计算机学报》2004年第6期736-742,共7页孙茂松 肖明 邹嘉彦 
国家自然科学基金 ( 60 0 83 0 0 5 )资助
探讨了基于无指导学习策略和无词表条件下的汉语自动分词方法 ,以期对研制开放环境下健壮的分词系统有所裨益 .全部分词知识源自从生语料库中自动获得的汉字Bigram .在字间互信息和t 测试差的基础上 ,提出了一种将两者线性叠加的新的统...
关键词:无指导学习 汉语自动分词 汉字Bigram 互信息 t-测试差 线性叠加 统计量 中文信息处理应用系统 
当代汉语新词的多元化趋向和地区竞争被引量:40
《语言教学与研究》2003年第2期12-21,共10页邹嘉彦 游汝杰 
本文利用香港城市大学“各地中文共时语料库”研究海内外汉语新词,有以下几项发现:(1)外来词始生阶段有多元化倾向;(2)方言词汇在不同地区之间互相渗透;(3)新词有从南向北扩散的倾向;(4)新词演变有三种状态:某种形式占优势、尚不分胜负...
关键词:当代汉语 新词 多元化 地区竞争 外来词 语料库 输入途径 
利用上下文信息解决汉语自动分词中的组合型歧义被引量:24
《计算机工程与应用》2001年第19期87-89,106,共4页肖云 孙茂松 邹嘉彦 
国家重点基础研究发展规划项目资助课题(课题编号:G1998030507)
组合型歧义切分字段一直是汉语自动分词研究中的一个难点。该文将之视为与WordSenseDisambiguation(WSD)相等价的问题。文章借鉴了WSD研究中广泛使用的向量空间法,选取了20个典型的组合型歧义进行了详尽讨论。提出了根据它们的分布“分...
关键词:自然语言处理 中文计算 汉语自动分词 组合型歧义切分字段 中文信息处理 
汉语自动分词研究评述被引量:102
《当代语言学》2001年第1期22-32,共11页孙茂松 邹嘉彦 
国家自然科学基金(项目号:69705005);国家重点基础研究发展规划项目(项目号:G1998030507)
本文首先阐述了汉语自动分词研究的现实性和可能性,接着围绕该研究中的三个基本问题(切分歧义消解、未登录词处理和语言资源建设)展开了重点讨论,并扼要评介了十几年来产生的各种方法。最后就这个领域未来的研究要点发表了一些个人意见。
关键词:汉语 自动分词 中文信息处理 语言资源 歧义 
检索报告 对象比较 聚类工具 使用帮助 返回顶部