Análise de Viés no Modelo BERTimbau para detecção de discurso de ódio em Português Brasileiro

Oliveira Filho, José Fernando de

Análise de Viés no Modelo BERTimbau para detecção de discurso de ódio em Português Brasileiro

dc.contributor.advisor	Gouveia, Roberta Macedo Marques
dc.contributor.advisorLattes	http://lattes.cnpq.br/2024317361355224
dc.contributor.author	Oliveira Filho, José Fernando de
dc.date.accessioned	2026-03-31T13:46:13Z
dc.date.issued	2026-02-12
dc.degree.departament	Estatística e Informática
dc.degree.graduation	Bacharelado em Sistemas da Informação
dc.degree.level	bachelor's degree
dc.degree.local	Recife
dc.description.abstract	A expansão das redes sociais intensificou a circulação de discursos de ódio online, gerando desafios à convivência democrática e à proteção de grupos minoritários. Diante da inviabilidade da moderação manual, este trabalho aplica técnicas de Processamento de Linguagem Natural (PLN) e Aprendizado de Máquina (ML) para a identificação de conteúdo ofensivo em português brasileiro. O estudo investiga o viés algorítmico do modelo BERTimbau, ajustado via fine-tuning e treinado sobre as bases anotadas ToLD-BR e Tupy-E. A avaliação considera métricas tradicionais de desempenho (precisão, recall, F1-score) e de equidade (Paridade Demográfica), com o objetivo de examinar possíveis associações indevidas entre termos de identidade social e discurso de ódio, contribuindo para o debate sobre justiça algorítmica. Os resultados evidenciaram padrões estruturados de viés do BERTimbau entre os eixos de gênero, raça e orientação sexual, bem como entre grupos específicos dentro de cada eixo (por exemplo, mulheres, pessoas bissexuais, gays e pardas), mostrando que o modelo tende a associar esses termos de identidade ao discurso de ódio com maior frequência do que seus grupos de referência, mesmo em contextos neutros ou positivos.
dc.description.abstractx	The expansion of social networks has intensified the spread of hate speech online, posing challenges to democratic coexistence and the protection of minority groups. Given the impracticality of manual moderation, this study applies Natural Language Processing (NLP) and Machine Learning (ML) techniques to identify offensive content in Brazilian Portuguese. It investigates algorithmic bias in the BERTimbau model, fine-tuned and trained on the annotated ToLD-BR and Tupy-E datasets. The evaluation employs both traditional performance metrics (precision, recall, F1-score) and fairness metrics (Demographic Parity) to examine potential unjust associations between social identity terms and hate speech, contributing to discussions on algorithmic fairness. The results revealed structured patterns of bias across the gender, race, and sexual orientation axes, as well as across specific groups within each axis (e.g., women, bisexual, gay, and brown people), showing that the model tends to associate these social identity terms with hate speech more frequently than their reference groups, even in neutral or positive contexts.
dc.format.extent	36f.
dc.identifier.citation	OLIVEIRA FILHO, José Fernando de. Análise de Viés no Modelo BERTimbau para detecção de discurso de ódio em Português Brasileiro. 2026. 36 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2026.
dc.identifier.uri	https://arandu.ufrpe.br/handle/123456789/8418
dc.language.iso	pt_BR
dc.publisher.country	Brazil
dc.publisher.initials	UFRPE
dc.rights	openAccess
dc.rights.license	Attribution-NonCommercial-ShareAlike 4.0 International	en
dc.rights.uri	http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.subject	Redes sociais on-line
dc.subject	Discurso de ódio na Internet
dc.subject	Processamento de linguagem natural (Computação)
dc.subject	Aprendizado do computador
dc.subject	Discriminação em linguagem
dc.title	Análise de Viés no Modelo BERTimbau para detecção de discurso de ódio em Português Brasileiro
dc.type	bachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1

Nome:: tcc_josefernandodeoliveirafilho.pdf
Tamanho:: 765.87 KB
Formato:: Adobe Portable Document Format

Baixar

Licença do pacote

Agora exibindo 1 - 1 de 1

Nome:: license.txt
Tamanho:: 1.87 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Baixar

Coleções

TCC - Bacharelado em Sistemas da Informação (Sede)