Navegando por Assunto "Clusterização"

Agora exibindo 1 - 3 de 3

Aprendizado de máquina não supervisionado aplicado na dinâmica de preços de combustíveis no Brasil
(2025-08-05) Lima, Andressa Luana Santana de; Gouveia, Roberta Macedo Marques; http://lattes.cnpq.br/2024317361355224; http://lattes.cnpq.br/0993590347039876
Este trabalho realiza uma análise exploratória e de clusterização dos dados públicos da Agência Nacional do Petróleo (ANP) para os preços de combustíveis no Brasil em 2024. A partir de variáveis numéricas agregadas por região e por produto, foi aplicado o algoritmo K-means para identificar padrões de comportamento no mercado. As variáveis selecionadas buscaram representar aspectos como níveis médios de preço, variações sazonais, volume de registros e distribuição de revendas. Os resultados apontaram diferenças estruturais entre regiões e entre combustíveis, evidenciando a heterogeneidade do setor. O estudo evidencia a importância do uso de técnicas de agrupamento para explorar padrões relevantes no mercado de combustíveis.
Avaliação de algoritmo de clusterização para segmentação de nuvens de pontos 3D
(2022-10-05) Melo, Davi de Almeida; Ferreira, Felipe Alberto Barbosa Simão; http://lattes.cnpq.br/9939255113143786; http://lattes.cnpq.br/3528552393951602
As tecnologias 3D têm sido exploradas nas diversas áreas da indústria. Com essas tecnologias são executadas funções como visualização, instrumentação, controle, simulação, treinamento, planejamento, documentação, entre outros. A partir disso, novos tipos de mídia foram introduzidos a esse contexto industrial. Como exemplo, existem as nuvens de pontos, que trata-se de um conjunto de pontos distribuídos num modelo tridimensional da realidade. Elas, geralmente, são construídas através da atuação de um scanner e podem conter em cada um de seus pontos as características de um objeto como localização, cor, reflectância e entre outros aspectos. Dado que as nuvens de pontos irão representar peças, equipamentos, tubulações, máquinas, áreas, e estruturas no contexto industrial, conseguir segmentar as nuvens de pontos e possibilitar uma melhor visualização das partes separadas da mesma estrutura é uma ferramenta proveitosa. Além disso, dentre as funções das tecnologias 3D apresentadas, a segmentação de nuvens de pontos perpassa de forma direta e indireta as áreas de visualização, instrumentação e controle. Portanto, verificada a importância da segmentação de nuvens de pontos, o objetivo desta monografia é avaliar dois algoritmos de clusterização para segmentação de nuvens de pontos 3D. São eles, o DBSCAN e o K-means. Ambos estão categorizados como algoritmos de clusterização por meio aprendizagem de máquina não supervisionada. Após a avaliação, foram constatadas as diferenças entre cada algoritmo. Verificou-se um melhor desempenho por parte do K- means quando se trata de dados dispersos e o equivalente para o DBSCAN quando se referem a distribuição de dados com certa distância entre os clusters.
Comparação de técnicas de redução de dimensionalidade aplicadas à clusterização de dados do censo da educação superior
(2025-08-08) Mercês, Thamires Lopes das; Albuquerque Júnior, Gabriel Alves de; http://lattes.cnpq.br/1399502815770584; http://lattes.cnpq.br/8266687622316308
A grande quantidade de informações coletadas em censos da educação e avaliações nacionais demanda métodos eficientes para extração de conhecimento, permitindo identificar padrões e tendências relevantes. Nesse contexto, a clusterização se destaca como uma ótima técnica para segmentar e interpretar grandes volumes de dados educacionais, sendo o K-Means um dos algoritmos mais utilizados devido à sua simplicidade e eficiência. No entanto, quando aplicado a conjuntos de dados de alta dimensionalidade, seu desempenho pode ser comprometido, tornando necessário o uso de técnicas de redução de dimensionalidade como Principal Component Analysis (PCA), t-Distributed Stochastic Neighbor Embedding (t-SNE) e Uniform Manifold Approximation and Projection (UMAP). Este trabalho investiga o impacto dessas técnicas na qualidade dos agrupamentos gerados pelo K-Means em uma base de dados composta pela junção dos Microdados do Censo da Educação Superior de 2022 e os indicadores de qualidade educacional Conceito Enade e CPC. A análise é realizada utilizando o índice de silhueta como métrica de avaliação e comparando o tempo de execução de cada método. Com dois componentes, o PCA superou o t-SNE e o UMAP na maioria dos testes. Com três componentes, o PCA teve melhor desempenho que o t-SNE em todos os testes, mas ficou equilibrado com o UMAP, onde foi superior em cinco dos nove cenários. Observou-se, ainda, que a quantidade de clusters teve influência relevante nos resultados, especialmente no desempenho crescente do UMAP à medida que se aumentava o número de clusters. O UMAP e o t-SNE mostraram resultados equilibrados com dois componentes. Porém, com três componentes, o UMAP se mostrou melhor em todos os cenários. Além disso, o PCA foi a técnica mais rápida em todos os cenários avaliados, superando tanto o t-SNE quanto o UMAP em termos de tempo de execução.