Banca de DEFESA: DÁRCIO SANTOS ROCHA

Uma banca de DEFESA de MESTRADO foi cadastrada pelo programa.
DISCENTE : DÁRCIO SANTOS ROCHA
DATA : 14/08/2023
HORA: 14:00
LOCAL: https://conferenciaweb.rnp.br/ufba/defesas-do-formas
TÍTULO:

IDENTIFICAÇÃO DE TIPOS DE RELAÇÕES TEMPORAIS EVENT-TIME EM PORTUGUÊS: UMA ABORDAGEM BASEADA EM REGRAS COM CLASSIFICAÇÃO ASSOCIATIVA


PALAVRAS-CHAVES:

Extração de Informações, Relações Temporais, Processamento de Linguagem Natural


PÁGINAS: 127
RESUMO:

Este trabalho tem como objetivo desenvolver um método computacional para identificar tipos de relações temporais entre eventos e expressões temporais em textos escritos em língua portuguesa. A fim de alcançar esse objetivo, serão empregadas técnicas de aprendizado de regras para descobrir as melhores combinações de informações linguísticas disponíveis, formulando regras de decisão que possam identificar eficientemente os tipos de relações temporais entre eventos e expressões temporais. A maioria dos trabalhos relacionados adotou uma abordagem baseada em aprendizagem de máquina, enquanto apenas um utilizou uma abordagem híbrida, combinando regras manuais. A metodologia proposta neste trabalho consiste em uma abordagem baseada em regras, que incorpora informações lexicais, morfossintáticas e contextuais, tempos verbais de Reichenbach, sinais temporais e conhecimento sobre o mundo, além das anotações TimeML no corpus. Ao contrário de uma abordagem puramente baseada em aprendizagem de máquina, os conjuntos de regras gerados pelo nosso método permitem a combinação de regras geradas pelos diferentes algoritmos, ou a combinação de conjuntos completos, o que pode resultar em melhor desempenho. Em resumo, o método recebe pares de evento/expressão temporal como entrada e utiliza uma estratégia de filtragem para selecionar os pares com maior probabilidade de terem sido anotados no corpus. Em seguida, aplica conjuntos de regras em cada par para identificar o tipo da relação temporal existente e uma estratégia de aumento de dados para calcular o fechamento temporal de todos os pares e suas respectivas relações identificadas. Em experimentos preliminares, propusemos um conjunto inicial de regras manuais para o idioma português. No entanto, os resultados obtidos demonstraram que esse conjunto era limitado, resultando em baixa cobertura e consequentemente baixa acurácia. O valor máximo alcançado foi de 45,1% de acurácia e 34,1% de cobertura nos dados de teste. Para melhorar esses resultados, propomos incorporar técnicas de aprendizagem de regras ao método, visando aumentar o conjunto de regras. Essas técnicas são capazes de lidar bem com dados contendo ruídos, funcionar bem em dados não vistos e gerar regras mais eficientes, além de oferecer desempenho competitivo e funcionar de forma eficiente. Com essa incorporação, esperamos que os experimentos propostos produzam um conjunto de regras capaz de identificar tipos de relações temporais event-time com eficiência e alcance resultados superiores. Isso contribuirá para o avanço do estado da arte na área, além de disseminar a pesquisa realizada e contribuir com a comunidade científica.


MEMBROS DA BANCA:
Presidente - 2352062 - MARLO VIEIRA DOS SANTOS E SOUZA
Interno - 3069553 - ROBESPIERRE DANTAS DA ROCHA PITA
Externo ao Programa - 3551858 - RERISSON CAVALCANTE DE ARAUJO - UFBA
Notícia cadastrada em: 10/08/2023 22:36
SIGAA | STI/SUPAC - - | Copyright © 2006-2024 - UFBA