国际音标字符识别及其应用研究  

Optical Character Recognition of the International Phonetic Alphabet:Research and Applications

在线阅读下载全文

作  者:龙从军[1] 郭承禹 LONG Congjun;GUO Chengyu

机构地区:[1]中国社会科学院民族学与人类学研究所,北京100081 [2]北京师范大学文理学院,珠海519085

出  处:《民族语文》2025年第1期3-12,共10页Minority Languages of China

基  金:中国社会科学院实验室孵化专项项目“基于民族语言多模态数据的共性特征计算研究(2024SYFH008)”的资助。

摘  要:国际音标是一种运用范围广泛的语音记录和书写符号系统。国际音标光学字符识别技术可实现国际音标的批量识别,将极大地提高国际音标的处理效率,对民族语言和汉语方言资源数字化及基础研究都极具价值。本文推介一款由作者研发的国际音标识别模型“IPAOCR-IEA”。该模型在63万条国际音标图文对照数据的基础上利用卷积神经网络模型训练而成,可以高效识别国际音标。其整词精度、字符查准率和查全率等多项指标的最好结果均高于98%。此外,该模型轻量化的“龙水国际音标识别软件”现已推出,用户可以用其截取国际音标图片并自动获取截图中的国际音标字符。The International Phonetic Alphabet(IPA)is a widely used system for phonetic notation and transcription.Optical character recognition(OCR)technology of IPA can enable bulk IPA recognition,significantly improving the efficiency of IPA processing.This technology is of high value for the digitization of linguistic resources and research on ethnic minority languages and Chinese dialects.This paper presents"IPAOCR-IEA",an innovative IPA recognition model developed by the authors.The model,trained on a dataset of over 630,000 IPA image-text pairs,utilizes a convolutional neural network and can efficiently identify IPA characters.It achieves top performance across several metrics,including word accuracy,character precision,and recall,with all metrics exceeding 98%.Additionally,the lightweight"Longshui IPA OCR Software"based on this model has been launched,enabling users to automatically capture images and extract IPA characters from the selected regions.

关 键 词:国际音标 光学字符识别 模型 国际音标自动识别 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象