检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:龙从军[1] 郭承禹 LONG Congjun;GUO Chengyu
机构地区:[1]中国社会科学院民族学与人类学研究所,北京100081 [2]北京师范大学文理学院,珠海519085
出 处:《民族语文》2025年第1期3-12,共10页Minority Languages of China
基 金:中国社会科学院实验室孵化专项项目“基于民族语言多模态数据的共性特征计算研究(2024SYFH008)”的资助。
摘 要:国际音标是一种运用范围广泛的语音记录和书写符号系统。国际音标光学字符识别技术可实现国际音标的批量识别,将极大地提高国际音标的处理效率,对民族语言和汉语方言资源数字化及基础研究都极具价值。本文推介一款由作者研发的国际音标识别模型“IPAOCR-IEA”。该模型在63万条国际音标图文对照数据的基础上利用卷积神经网络模型训练而成,可以高效识别国际音标。其整词精度、字符查准率和查全率等多项指标的最好结果均高于98%。此外,该模型轻量化的“龙水国际音标识别软件”现已推出,用户可以用其截取国际音标图片并自动获取截图中的国际音标字符。The International Phonetic Alphabet(IPA)is a widely used system for phonetic notation and transcription.Optical character recognition(OCR)technology of IPA can enable bulk IPA recognition,significantly improving the efficiency of IPA processing.This technology is of high value for the digitization of linguistic resources and research on ethnic minority languages and Chinese dialects.This paper presents"IPAOCR-IEA",an innovative IPA recognition model developed by the authors.The model,trained on a dataset of over 630,000 IPA image-text pairs,utilizes a convolutional neural network and can efficiently identify IPA characters.It achieves top performance across several metrics,including word accuracy,character precision,and recall,with all metrics exceeding 98%.Additionally,the lightweight"Longshui IPA OCR Software"based on this model has been launched,enabling users to automatically capture images and extract IPA characters from the selected regions.
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.51