Construção de pipelines de dados sobre obras públicas em Pernambuco: abordagem prática com o Apache Airflow

dc.contributor.advisorAlbuquerque Júnior, Gabriel Alves de
dc.contributor.advisorLatteshttp://lattes.cnpq.br/1399502815770584
dc.contributor.authorSilva, Henrique César José da
dc.date.accessioned2024-07-02T10:48:25Z
dc.date.available2024-07-02T10:48:25Z
dc.date.issued2023-09-21
dc.degree.departamentEstatística e Informática
dc.degree.graduationBacharelado em Sistemas de Informação
dc.degree.grantorUniversidade Federal Rural de Pernambuco
dc.degree.levelGraduacao
dc.degree.localRecife
dc.description.abstractEste estudo apresenta uma abordagem prática para a construção de pipelines de dados voltados à coleta, transformação e armazenamento de informações relacionadas a obras públicas no estado de Pernambuco. O objetivo central é desenvolver fluxos de trabalho eficientes e automatizados para a extração de dados a partir de portais de transparência públicos, e a subsequente consolidação dessas informações. Com base em tecnologias de Engenharia de Dados, o framework Apache Airflow foi selecionado para a orquestração dos processos, permitindo o agendamento e monitoramento dos fluxos de trabalho.
dc.description.abstractxThis study presents a practical approach to building data pipelines focused on collecting, transforming, and storing information related to public works in the state of Pernambuco. The central objective is to develop efficient and automated workflows for extracting data from public transparency portals and subsequently consolidating this information. Based on Data Engineering technologies, the Apache Airflow framework was chosen to orchestrate the processes, enabling the scheduling and monitoring of these workflows.
dc.format.extent42 f.
dc.identifier.citationSILVA, Henrique César José da. Construção de pipelines de dados sobre obras públicas em Pernambuco: abordagem prática com o Apache Airflow. 2023. 42 f. Trabalho de Conclusão de Curso (Bacharelado em Sistemas de Informação) – Departamento de Estatística e Informática, Universidade Federal Rural de Pernambuco, Recife, 2023.
dc.identifier.darkflstrmvhttps://n2t.net/ark:/57462/001300000gbdm
dc.identifier.urihttps://repository.ufrpe.br/handle/123456789/5846
dc.language.isopor
dc.publisher.countryBrasil
dc.rightsopenAccess
dc.rights.licenseATRIBUIÇÃO 4.0 INTERNACIONAL (CC BY 4.0)pt_BR
dc.rights.urihttps://creativecommons.org/licenses/by/4.0/
dc.subjectArmazenamento de dados
dc.subjectObras públicas
dc.subjectTransparência na administração pública
dc.subjectFluxo de dados (Computadores)
dc.subjectAutomação
dc.subjectFluxo de trabalho
dc.titleConstrução de pipelines de dados sobre obras públicas em Pernambuco: abordagem prática com o Apache Airflow
dc.typebachelorThesis

Arquivos

Pacote original

Agora exibindo 1 - 1 de 1
Imagem de Miniatura
Nome:
tcc_art_henriquecesarjosedasilva.pdf
Tamanho:
949.52 KB
Formato:
Adobe Portable Document Format
Descrição:

Licença do pacote

Agora exibindo 1 - 1 de 1
Nenhuma Miniatura Disponível
Nome:
license.txt
Tamanho:
1.87 KB
Formato:
Item-specific license agreed upon to submission
Descrição: