CONTRIBUIÇÃO AO DESENVOLVIMENTO DE UM MÓDULO AUDITIVO PARA ROBOTICA ASSISTIVA
Redes Neurais Artificiais; Extração de Descritores; MFCC; Reconhecimento de Emoções; Reconhecimento Automático de Emoções; Análise de Componentes Independentes;
Este trabalho propõe um sistema automático para reconhecimento de locutor e emoções através do sinal de voz com a aplicação de técnicas de processamento estatístico de sinais como a análise de componentes principais e a análise de componentes independentes e classificadores neurais artificiais. Inicialmente são extraídos descritores característicos de sinais de áudio e voz como os coeficientes cepstrais na frequência mel a partir dos arquivos de áudio disponíveis nos bancos de dados utilizados. Após essa etapa são aplicadas análise de componentes principais e análise de componentes independentes com o intuito de redução da dimensionalidade e remoção da informação redundante entre os parâmetros que serão apresentados a entrada da rede neural shallow. A fim de comparação entre classificadores , também, são utilizados redes neurais convolucionais pré treinadas e redes neurais recorrentes com célula da memória LSTM e BLSTM. Os resultados obtidos mostram que a utilização de técnicas de processamento estatístico de sinais auxiliam no aumento da eficiência do classificador MLP e que classificadores neurais profundos (CNN) pré treinados, em um banco de dados de imagens, podem ser utilizados para a tarefa de reconhecimento automático de emoções e locutores alcançando uma boa eficiência de discriminação.