Uma Investigação sobre Análise de Sentimentos e Categorização de Issues Reabertas do GitHub
Reabertura de issues, análise de sentimentos, categorização de issues, mineração de repositório de software.
A reabertura de issues representa um desafio significativo no desenvolvimento e manutenção de software, aumentando os custos e a complexidade dos esforços envolvidos. Essa ocorrência muitas vezes indica problemas não resolvidos ou mal compreendidos na comunicação entre os colaboradores do projeto e os usuários em plataformas como o GitHub.
Esta tese tem como objetivo aprofundar a compreensão do conceito de reabertura de issues em repositórios de software de código aberto do GitHub, considerando dados históricos, categorização de issues e análise de sentimentos dos desenvolvedores presentes nas discussões associadas a essas issues.
Nossa metodologia envolveu o uso da ferramenta SentiStrength-SE, adaptada para léxicos da área de Engenharia de Software, para calcular a polaridade e o sentimento nos textos das discussões relacionadas às issues. Em seguida, desenvolvemos um modelo de categorização automática de issues, classificando-as em categorias específicas, como banco de dados, configuração, desempenho, funcional, GUI, info, permissão/obsoleto, redes, segurança e testes. Essa abordagem permite uma priorização mais eficaz na resolução das issues reabertas, direcionando recursos de forma mais precisa. Por último, caracterizamos a reabertura de issues de acordo com os sentimentos dos desenvolvedores contidos nos textos das discussões em cada categoria de issue.
Os resultados revelaram que a análise de sentimentos, quando aplicada isoladamente, não mostrou uma métrica eficaz para identificar reabertura de issues. No entanto, identificamos que certos tipos de categorias de issues estão mais propensos a problemas relacionados à reabertura. Isso aponta para a importância da categorização de issues em conjunto com a análise de sentimentos para uma abordagem mais eficiente na prevenção e tratamento das reabertura de issues em repositórios de software de código aberto.