Detecção de anomalias em dados meteorológicos do sertão de Pernambuco utilizando Isolation Forest e DBSCAN

Imagem de Miniatura

Data

2022-06-02

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

Anomalous values are one of the problems present in the Big Data age. Robust techniques are required to manipulate correct and incorrect information that is generated at each time. Using non-supervised machine learning algorithms gives the confidence of good performance in the final results. This research will use meteorological data on air temperature and relative humidity from the Instituto Nacional de Meteorologia, of Petrolina, with DBSCAN (Density Based Spatial Clustering of Application with Noise) and IF (Isolation Forest) implemented to detect anomalies present in the data, since weathering meteorological anomalies may appear through defects, bad sensor configuration and even extreme climate effects.

Descrição

Valores anômalos são uns dos problemas presentes na era do Big Data. São necessárias técnicas robustas para a manipulação de informações corretas e incorretas que a cada instante são geradas. O uso de algoritmos de aprendizado de máquina não supervisionados dá a confiança de um bom desempenho nos resultados finais. Esta pesquisa utilizará dados meteorológicos de temperatura e umidade relativa do ar vindos do Instituto Nacional de Meteorologia, de Petrolina, com o DBSCAN (Density Based Spatial Clustering of Application with Noise) e o IF (Isolation Forest) implementados para detectar anomalias presentes nos dados, visto que anomalias meteorológicas podem aparecer por meio de defeitos, má configuração dos sensores e até mesmo efeitos climáticos extremos.

Palavras-chave

Algoritmos computacionais, Aprendizado do computador, Meteorologia

Referência

CAVALCANTE, Anderson Rodrigues. Detecção de anomalias em dados meteorológicos do sertão de Pernambuco utilizando Isolation Forest e DBSCAN. 2022. 22 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2022.

Avaliação

Revisão

Suplementado Por

Referenciado Por