PGMAT PROGRAMA DE PÓS-GRADUAÇÃO EM MATEMÁTICA (PGMAT) INSTITUTO DE MATEMÁTICA E ESTATÍSTICA Telefone/Ramal: Não informado

Banca de DEFESA: TATIANA FELIX DA MATTA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : TATIANA FELIX DA MATTA
DATA : 06/08/2021
HORA: 14:30
LOCAL: Salvador
TÍTULO:

Novos modelos de regressão binária usando funções de ligação simétricas e assimétricas


PALAVRAS-CHAVES:

Dados desbalanceados, distribuição double Lindley, ligações potência e reversa de potência, método de máxima verossimilhança, performance preditiva


PÁGINAS: 53
RESUMO:

Os modelos de regressão com variáveis respostas binárias (1 - ocorrência do evento de interesse ou "sucesso'', 0 - não ocorrência do evento de interesse ou "fracasso'') têm sido aplicados intensamente em diversas áreas do conhecimento, como saúde, finanças, indústria, entre outras. Tradicionalmente, o modelo mais usado na regressão binária tem sido o modelo de regressão logística. Contudo, ele utiliza a função de ligação logit (ou logito), a qual é uma função de ligação simétrica e pode não ser adequada em determinadas situações, por exemplo, quando uma das classes da variável resposta é desbalanceada em relação à outra (conjunto de dados desbalanceados). Este trabalho tem como objetivo principal apresentar novos modelos de regressão binária usando funções de ligação simétricas e assimétricas. A estimação dos parâmetros dos modelos propostos (a saber: modelos de regressão binária double Lindley, double Lindley assimétrica, potência double Lindley e reversa de potência double Lindley) é feita pelo método clássico da máxima verossimilhança. Para comparação e seleção do "melhor'' modelo dentre as diferentes distribuições, são empregados critérios de informação (AIC e BIC) e medidas de avaliação da capacidade preditiva (AUC, acurácia balanceada, sensibilidade, especificidade, valores de predição positivo e negativo, F1-Score, coeficiente de correlação de Matthews, dentre outras). Os resultados da análise de dois conjuntos de dados reais, um sobre câncer de mama, obtido do UCI (University of California, Irvine) Machine Learning Repository, e outro referente a uma competição promovida pelo Banco Santander para a comunidade do Kaggle, mostram que os modelos com as funções de ligação propostas podem apresentar melhor ajuste e performance preditiva do que os modelos usando ligações tradicionais, como a logito.


MEMBROS DA BANCA:
Presidente - 1961783 - PAULO HENRIQUE FERREIRA DA SILVA
Interno - 2019094 - PAULO JORGE CANAS RODRIGUES
Externo à Instituição - FRANCISCO LOUZADA NETO - USP
Notícia cadastrada em: 28/07/2021 10:20
SIGAA | STI/SUPAC - - | Copyright © 2006-2023 - UFBA