检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:单小岩 张结 戴礼荣[1] SHAN Xiaoyan;ZHANG Jie;DAI Lirong(School of Information Science and Technology,University of Science and Technology of China,Hefei 230022,China)
机构地区:[1]中国科学技术大学信息科学技术学院,合肥230022
出 处:《小型微型计算机系统》2024年第10期2305-2311,共7页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(62101523)资助;合肥市自然科学基金项目(2022012)资助;中央高校基本科研业务经费项目(YD2100002008)资助.
摘 要:自动音乐转写,即利用程序将音乐音频转写成音符的形式,是音乐信息检索的一项重要课题.目前基于深度学习的转写算法多源自语音识别、自然语言处理等领域,缺乏对音乐自身特性的深入研究.本文采用Transformer架构进行钢琴音乐转写,利用合成的音乐数据进行预训练,并设计了符合音符事件结构的截止点识别网络,旨在尝试对转写中的音乐特性进行针对性设计.本文的方法一方面利用了音乐合成技术成熟、便捷的方案,易于数据扩充;另一方面从目标检测的角度进行剖析,对音符本身的事件特性加以探讨.实验表明,本文采用合成音乐进行预训练有助于音符识别,截止点识别网络可以提高音符级的转写结果,实现了音符起点F1=97.40%,带截止点音符F1=88.81%的转写结果.Automatic music transcription,i.e.,the use of programs to transcribe music audio into note form,is an important topic in music information retrieval.Most of the current deep learning-based transcription algorithms come from the fields of speech recognition,natural language processing,etc.,and lack in-depth research on the characteristics of music itself.In this paper,we use Transformer architecture for piano music transcription,pre-train using synthesized music data,and design a cut-off point recognition network conforming to the structure of note events,aiming to try to design a targeted approach to the music characteristics in transcription.The approach in this paper takes advantage of the mature and convenient scheme of music synthesis technology for easy data expansion on the one hand;on the other hand,it explores the event characteristics of the notes themselves by profiling them from the perspective of target detection.Experiments show that this paper uses synthetic music for pre-training is beneficial to note recognition,and the cut-off point recognition network can improve the transcription results at the note level,achieving the transcription results of note starting point F1=97.40%and note with cut-off point F1=88.81%.
关 键 词:钢琴音乐转写 TRANSFORMER 合成音乐预训练 音符事件特性 目标检测
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.63