Análise da Mudança Semântica Lexical: identificação e caracterização na Língua Portuguesa
Processamento de Linguagem Natural, Modelos de Linguagem, Polissemia.
A Mudança Semântica Lexical (MSL) na língua portuguesa ao longo do tempo, com foco
no uso de modelos de linguagem contextuais. A MSL, que se refere à alteração do significado
das palavras ao longo do tempo, é um fenômeno complexo e multifacetado que
reflete as mudanças culturais, sociais e tecnológicas da sociedade (AITCHISON, 2002).
A compreensão da MSL tem aplicações em diversas áreas, desde a linguística histórica
até o Processamento de Linguagem Natural (PLN). A proposta destaca os desafios da
detecção e interpretação da MSL, como a polissemia (uma palavra com múltiplos sentidos)
e a natureza gradual e sutil da mudança semântica. Para abordar esses desafios, a
pesquisa propõe a utilização de espaços semânticos contextualizados, gerados por modelos
como o BERT (DEVLIN et al., 2019), que capturam o significado das palavras em
seus contextos específicos. A hipótese central é que esses espaços semânticos contextualizados
podem representar as mudanças de unidades lexicais da língua portuguesa. Porém
o aspecto temporal destas abordagens fica limitado aos dados e não são representados.
Assim, o presente projeto de pesquisa propõe a construção de um corpus diacrônico da
língua portuguesa com o objetivo de gerar embeddings contextuais que detenham características
temporais para detectar, quantificar e interpretar a mudança semântica lexical.
A validação da abordagem explorará diferentes métricas e abordagens. Espera-se que
esta pesquisa contribua para o avanço do conhecimento na área de MSL, fornecendo um
modelo para a análise da mudança semântica lexical com a identificação temporal na
língua portuguesa.