ESTIMATIVA DE ANDAMENTO MUSICAL ATRAVÉS DE ESCALOGRAMAS WAVELET E REDES NEURAIS CONVOLUCIONAIS
Andamento Musical, Wavelet, Escalograma, Rede Neural Convolucional, Aumento artificial de dados, MIR.
A estimativa de andamento é uma das tarefas mais fundamentais da Recuperação da Informação Musical (MIR - Musical Information Retrieval). Neste trabalho foi utilizada uma representação do sinal de áudio como uma imagem bidimensional através do escalograma wavelet. Foram testadas diferentes formas de geração do escalograma wavelet, variando a função wavelet analisadora e os níveis de escala. As imagens foram utilizadas para treinar uma Rede Neural Convolucional (CNN - Convolutional Neural Network) realizando um aprendizado supervisionado, relacionando a imagem com um valor de andamento alvo. O método de validação cruzada k-fold foi utilizado para garantir a generalização do modelo proposto e definir a forma de geração do escalograma que mais adequada ao problema. Foi implementado o aumento artificial de dados de forma online, modificando os escalogramas antes do treinamento. Por fim, o modelo foi avaliado em bancos de dados amplamente utilizados na literatura e os resultados foram comparados ao estado da arte. Bons resultados foram atingidos em um dos bancos de dados de avaliação, o "GiantSteps", utilizando as wavelets analisadoras Morlet e Shannon.