Navegando por Autor "Macário Filho, Valmir"
Agora exibindo 1 - 10 de 10
- Resultados por Página
- Opções de Ordenação
Item Avaliação de algoritmos baseados em Deep Learning para Localizar placas veiculares brasileiras em ambientes complexos(2019) Marques, Bruno Henrique Pereira; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/3847789259699701Com o aumento da quantidade de veículos particulares, nota-se o crescimento do número de violações das leis de trânsito, roubo de veículos e assim, se faz necessário uma melhor gestão e fiscalização do tráfego. Um veículo e seu proprietário são reconhecidos através da placa veicular (PV) única e obrigatória, e para que sejam fiscalizados e terem dados extraídos com maior eficiência, é recomendável a utilização de sistemas automatizados para detecção e reconhecimento de placas veiculares. Este trabalho apresenta um estudo e avaliação de algoritmos baseados em Aprendizagem Profunda para localizar PV brasileiras em ambientes complexos. Para a realização dos experimentos, foi criado um banco de imagens de PV brasileiras baseada em problemas como imagens com resolução, qualidade, iluminação e perspectiva de cena diferentes. Foram utilizados os algoritmos de Aprendizagem Profunda YOLOv2 e YOLOv3, o qual ainda não foi estudado para o melhor do nosso conhecimento, neste contexto. Além disso, foi utilizado o algoritmo Tree-structured Parzen Estimator (TPE) para realizar a otimização de hiperparâmetros e maximizar o desempenho das redes neurais convolucionais selecionadas. Para a avaliação, foram utilizadas as métricas de desempenho: tempo de predição, Intersection over Union (IoU) e taxa de confiança. O resultado dos experimentos mostrou que o YOLOv3 apresentou melhor desempenho, obtendo 99.3% de detecção das placas veiculares.Item Avaliação de algoritmos de rastreamento no problema de detecção de pessoas no mar(2023-09-13T03:00:00Z) Nascimento, Ramicés Moisés do; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/0247140467691140Sabe-se que nas praias de Pernambuco, ataques de tubarões são um medo constante da população. Muitos desses ataques são fatais, o que faz necessário que alguma atitude seja tomada, visto que as praias de Pernambuco atraem milhares de turistas por ano. Assim, pesquisadores da UFRPE iniciaram uma pesquisa visando desenvolver um sistema de rastreamento de pessoas no mar, que torna possível avisar aos salvavidas quando as pessoas ultrapassarem uma área considerada segura na praia, além de poder alocar uma quantidade maior desses profissionais em lugares com maior número de pessoas. O sistema foi divido em três etapas: segmentação da imagem, detecção dos banhistas e rastreamento dos mesmos. Este trabalho foca na terceira etapa. Rastrear pessoas é uma tarefa complexa e com custo computacional alto. Problemas com mudanças de iluminação do ambiente, mudança na direção dos alvos e mudanças no plano de fundo são apenas algumas das dificuldades que podem ser citadas. Assim, o trabalho desenvolvido tem como objetivo avaliar seis algoritmos de rastreamento de pessoas presentes na literatura em imagens de praia. Primeiro, rotulou-se manualmente uma base de dados de dez vídeos gravados na praia de Boa Viagem, em Pernambuco. Depois foram escolhidos seis algoritmos para serem avaliados. Depois, foi comparado o resultado de cada quadro dado como resposta pelo algoritmo, com o que tinha sido anteriormente rotulado e tirou-se uma média. Então, tirou-se uma média geral para saber a taxa de acerto do algoritmo e o tempo de execução do mesmo. Por fim, o melhor algoritmo foi escolhido para otmização através de um algoritmo genético, e verificou-se se houve alguma melhora no resultado. O CSRT foi o algoritmo que obteve o melhor resultado e após a otimização com o algoritmo genético, obteve-se uma melhoria de 20% na sua acurácia.Item Classificação de banhistas na faixa segura de praia(2018) Silva, Ricardo Luna da; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/3088880066515750Visando evitar riscos em ambientes aquáticos,afogamentos e ataque de tubarão,áreas de praia devem ser monitoradas constantemente. Quando necessário, as equipes de resgate devem responder com velocidade ao caso. Este trabalho visa propor um algoritmo de classificação de pessoas como parte de um sistema para monitoramento automáticoemáreasdepraia.Certosfatoresdoambientesãobastantedesafiadores, como variação de brilho em dias nublados, a posição do sol em diferentes momentos do dia, dificuldade em segmentação de imagens, pessoas submersas e posição afastada da câmera. Para esse tipo de problema na literatura é comumente encontrado, para detecção de pessoas, o uso de descritores de imagem em conjunto com um classificador. Este trabalho realiza um estudo em imagens de praia usando os seguintes descritores de imagem e suas combinações em pares: Momentos de Hu, Momentos de Zernike,Filtro de Gabor,Histograma de Gradientes Orientados(HOG),Padrões Binários Locais(LBP) e Haar. Além disso,uma técnica de redução de dimensionalidade (PCA)é aplica para seleção de características. A taxa de detecção é avaliada com os seguintes classificadores :Random Forest, classificador e em cascata e Support Vector Machine(SVM) comkernel linear e radial.Os experimentos demonstraram que o classificador SVM com kernel radial usando os descritores HOG e LBP aplicando a técnica PCA mostrou resultados promissores, obtendo 90,31% de precisão.Item Classificação de imagens de textura geradas por gráficos de recorrências no problema de pessoas sofrendo ataques epiléticos(2019) Queiroz, Danielly de Moura Borba; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/7461629772562910A epilepsia é uma condição neurológica caracterizada pela ocorrência de crises epilépticas que se repetem em intervalos variáveis. Essas crises são manifestações clínicas de uma descarga anormal de neurônios, que são células que compõem o cérebro.Algumas particularidades tornam os diagnósticos precoces da epilepsia um grande desafio, até mesmo para clínicos mais experientes. Como auxilio médico, existem exames como o eletroencefalograma (EEG) representados por séries temporais bastante utilizado no diagnóstico da epilepsia. As séries temporais estão presentes em várias áreas de estudo, como a medicina, biologia, economia, entre outras. Seus gráficos expõem padrões ocultos e mudanças estruturais nos dados, como possuem padrões de textura bem definidos que podem ser identificados adequadamente por métodos de extração de textura. Além disso, existem diversas ferramentas para extração de informações das séries temporais, uma delas é a imagem de recorrência, que usualmente é utilizada para verificar a mudança de um padrão no sinal. Este trabalho apresenta um estudo de descritores de texturas e classificadores em imagens de pessoas saudáveis e epiléticas geradas por imagens de recorrências. Os descritores de texturas usando neste estudo foram: Padrões Binários Locais (LBP), Quantização de Fase Lo-cal (LPQ) e o Banco de Filtro de Gabor. Até o melhor do nosso conhecimento, ainda não foi realizado nenhum estudo aplicando-se esses descritores em imagens de recorrência na base utilizada neste trabalho. A avaliação é realizada através da taxa média de acerto, precisão, recall e f-measure resultante dos seguintes classificadores:Ran-dom Forest, eSupport Vector Machine(SVM). Os experimentos demonstraram que o classificador SVM usando o descritor LPQ mostrou resultados promissores, obtendo92,1% de média de acerto, recall e f-measure e para precisão obteve 92,26%.Item Comparação de algoritmos de reconhecimento de gestos aplicados à sinais estáticos de Libras(2019-07-12T03:00:00Z) Cruz, Lisandra Sousa da; Cordeiro, Filipe Rolim; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/4807739914511076; http://lattes.cnpq.br/2111589326272463A Língua Brasileira de Sinais (Libras) foi criada a fim de suprir uma necessidade de comunicação não-verbal para os surdos, que durante muito tempo foram doutrinados à ter o português como sua primeira língua. Atualmente, a Libras é a segunda língua oficial do Brasil e primeira língua dos surdos, assim como o português é para o ouvinte. Entretanto, mesmo com tamanho reconhecimento, a segunda língua oficial do Brasil não é conhecida pela maior parte da população brasileira. O processo de inclusão visa proporcionar igualdade aos deficientes, de forma que a deficiência não seja um fator impeditivo à convivência em sociedade. Com o advento da tecnologia e avanços da Inteligência Artificial (IA), foram criados artifícios tecnológicos visando propiciar inclusão. Na IA, o reconhecimento de padrões é um dos subtemas mais abordados na atualidade, sendo bastante aplicada para a classificação de gestos de diversas línguas de sinais na literatura. Essa pesquisa tem como principal tarefa identificar as mãos que formam um determinado sinal de Libras e em seguida reconhecer a que classe pertence, classificando-o. Baseado na classificação da Língua de Sinais Americana, a Feature Fusion-based Convolutional Neural Network (FFCNN), uma rede estendida da Convolutional Neural Network (CNN), obteve a melhor acurácia em comparação a outras redes, dentre elas a Visual Geometry Group (VGG). Diante desse cenário, esse trabalho aplica a FFCNN à gestos estáticos de Libras a fim de verificar se a FFCNN obtém a melhor acurácia assim como obteve na Língua de Sinais Americana. Para alcançar esse objetivo são comparados três classificadores: VGG com uma variação da CNN com 13 e 16 camadas; FFCNN e uma rede Multi Layer Perceptron (MLP) usada no reconhecimento de gestos estáticos de Libras na literatura. Os algoritmos foram aplicados em um dataset de Libras que contém 9.600 imagens de 40 sinais. Os resultados demonstram que a rede VGG com 16 camadas obteve a maior acurácia dentre modelos descritos neste trabalho, com valor de 99,45%.Item Detecção de linhas que separam o mar da areia e o mar do céu em imagens de praia(2018) Silva, Jeremias Leite da; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080A orla da região metropolitana de Pernambuco tem apresentado vários incidentes com tubarões e alguns desses casos foram fatais. Visando reduzir os incidentes, este trabalho propõe uma abordagem para segmentação do mar como parte de um sistema de monitoramento de banhistas através de câmeras. Uma vez que são identificadas uma ou mais pessoas dentro da zona de risco, o sistema emitirá um alerta a central de monitoramento, e o guarda-vida mais próximo seria alertado para se deslocar até o local. Para que o sistema identifique as pessoas na imagem, o sistema deve ser capaz de identificar a região de praia na imagem, afim de segmentá-las e identificar os banhistas. A faixa de água é formada por duas fronteiras, uma com o céu e a outra com a areia. A fronteira com o céu é uma linha reta horizontal denominada linha do horizonte, e a fronteira com a areia é um contorno formado pelo limite da água com a areia que é chamado de linha da costa. Esse trabalho visa propor algoritmos para detecção das linhas do horizonte e da costa para segmentação do mar, que representa uma das etapas principais para o sistema de monitoramento de banhista em imagens de praia. Neste trabalho foram analisados quatro algoritmos de detecção da linha do horizonte para avaliar quais desses obtém o melhor resultado na detecção. Dois algoritmos do estado da arte foram analisados: o de Lie et al. e o de Ahmad et al.. Ambos são trabalhos para detecção de linha do horizonte em imagens de montanhas, outros dois algoritmos foram contribuições desse trabalho: o Detecção da Linha do horizonte com Canny Edge Detection e Grafo Multiestágios (DLHCGME) e o Detecção da Linha do Horizonte com Sobel e transformada de Hough (DLHSTH). Para detecção da linha da costa foram propostos dois novos algoritmos: o Detecção da Linha da Costa com Canny Edge Detection e Grafo Multiestágios (DLCCGME) e Detecção da linha da costa baseado em contornos do canal hue (DLCCCH). Na detecção da linha do horizonte em imagens sem oclusões os experimentos demostram que o DLHCGME obteve o melhor resultado com uma taxa de erro de 0,47 e o segundo foi o DLHSTH com 1,11, e para imagens com oclusões o DLHSTH obteve o melhor resultado com taxa de erro de 1,98 e o DLHCGME foi o segundo melhor resultado com 2,62.Item Detecção de mãos através da combinação de técnicas de detecção de tom de pele e movimento para background complexo(2018-08-18T03:00:00Z) Sá, Vinícius Cavalcanti Nogueira de; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/1197232523837982A tecnologia tem como função social facilitar a vida de seus usuários. Com a evolução da mesma, e com o surgimento da globalização, o acesso à informação e a comunicação como um todo se tornaram muito mais disponíveis para população em geral. Ainda assim, grupos com necessidades especiais sofrem com a defasagem de produtos e sistemas que possam atender as suas necessidades. Este trabalho fará uso de tecnologias pré-existentes que possam ser usadas de modo a facilitar a vida desses usuários, mais especificamente surdos. Vivemos em um mundo onde nos deparamos com uma imensidão de dispositivos com câmeras, ou de equipamentos que podem ser conectados a uma. A visão computacional se torna muito importante ou senão essencial a partir dessa realidade. Diversas áreas utilizam imagens para automatizar ou auxiliar as suas atividades dentro de seus segmentos, sendo eles voltados para o entretenimento, indústria ou outros. Sendo assim, é possível perceber a importância do processamento de imagens como solução de problemas em áreas diversas. Neste trabalho foi utilizado o processamento de imagem para elaborar uma possível solução na área de reconhecimento de mãos. A utilização da mão como uma maneira de comunicação é evidente. Podemos vê-la como uma personagem principal não somente na comunicação cotidiana através de gestos, como também podemos utiliza-la no controle de interfaces computacionais, no auxílio na imersão em realidade virtual, na manipulação de objetos virtuais em uma realidade aumentada. Também podemos vê-la como facilitadora na acessibilidade a partir da comunicação por sinais, sendo este último exemplo o ponto chave deste trabalho, que visa facilitar a comunicação entre surdos e possíveis usuários interessados na língua de sinais através de uma nova abordagem. O reconhecimento de mão foi realizado por meio de uma abordagem híbrida envolvendo segmentação por tons de pele e movimento, esta abordagem foi escolhida para contornar as dificuldades que cada tipo de segmentação traz. A melhor taxa de acerto que tivemos com esta abordagem 76,4% em ambientes internos e 45,15% em ambientes externos.Item Segmentação de banhistas utilizando algoritmos de agrupamento com seleção automática do número de grupos em regiões litorâneas(2019) Moura, Allan Alves de; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/3319938637009294O crescente aumento de ataques de tubarões vem assustando a população das regiões litorâneas, impossibilitando a tomada de banho em certos locais. Em caso de ataque, muitas vezes uma ação para salvar a vítima é tomada somente após o ocorrido do incidente, em que um guarda-vidas tentará socorre-la. Para mitigar estes acontecimentos, foi pensado em uma ferramenta de auxílio aos guarda-vidas que permitissem aos mesmos agir antes que acidentes pudessem ocorrer, avisando o profissional caso algum banhista ultrapasse uma determinada zona de segurança. O primeiro passo para realização desta ferramenta é a segmentação das imagens de praia em busca de agrupar partes com características visualmente semelhantes afim de encontrar as pessoas dentro do mar. Para isso, o objetivo deste trabalho é estudar e encontrar um bom algoritmo de segmentação de imagens com seleção automática do número de grupos para evitar a necessidade do controle de parâmetros a fim de separar a foto em regiões ou segmentos. Este algoritmo será utilizado para a implementação da primeira etapa desta ferramenta de auxílio aos guarda-vidas em busca de regiões da imagem que representem banhistas. Técnicas de pré-processamento de imagens como a remoção da faixa de praia foram avaliadas, como também a avaliação de sistemas de cores diferentes na representação da imagem a fim de realizar a comparação entre todos esses fatores. A combinação dos algoritmos e sistemas de cores foram avaliados com e sem a remoção da faixa de praia. Os algoritmos analisados foram: Hierárquico aglomerativo, hierárquico divisivo, X-means, Auto group segmentation e segmentação automática de imagens coloridas. Todos eles foram aplicados pra três tipos diferentes de vetores de características, compostos por sistema de cor RGB(red, green e blue), LAB e a combinação de RGB + LAB. O resultado mais promissor, após avaliação visual das imagens, comportamento dos algoritmos e resultados do índice de Dunn, foi obtido utilizando o algoritmo de segmentação de imagens coloridas com vetor de características composto de RGB + LAB, totalizando para o índice de Dunn 1.5245 de média para todas as imagens, aplicando a remoção de praia depois da execução do algoritmo.Item Semantic segmentation for people detection on beach images(2021-03-01T03:00:00Z) Monte, Leonardo de Araujo; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/0547792731866043As câmeras de monitoramento estão sendo cada vez mais aperfeiçoadas com o uso de sistemas de visão computacional capazes de identificar situações de risco. Este trabalho faz parte de um sistema de rastreamento automático de monitoramento de praias na região metropolitana do Recife, com o objetivo de evitar que banhistas ultrapassem os limites seguros na região de banho de praia. A segmentação semântica tem ganhado força em diferentes tarefas de visão computacional. Geralmente a metaarquitetura de uma rede de segmentação semântica consiste em dois módulos: codificador (backbone) e decodificador. Este trabalho realiza um estudo combinando um conjunto de redes de segmentação semântica, Unet, Xnet, LinkNet e Unet++ com os backbones prétreinados VGG16 e VGG19, com o objetivo de detectar banhistas em imagens de praia. Nós utilizamos a nossa própria base de dados, constituída de diferentes imagens da praia de Boa Viagem, RecifeBrasil. Os algoritmos foram avaliados com a métrica MIoU utilizando toda a cena da imagem, e apenas a faixa de mar. O melhor resultado de MIoU com relação à imagem completa foi 80.87%, e foi obtido pela XNet com o backbone da VGG19. O melhor MIoU na detecção de banhistas na faixa de mar obteve 85.56% e foi alcançado com a LinkNet com os backbones da VGG16 e VGG19.Item Um currículo de aprendizado por reforço para o cenário “Run to Score with Keeper” do Google Research Football Environment(2019-12-10T03:00:00Z) Silva, Jonatan Washington Pereira da; Sampaio, Pablo Azevedo; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/8865836949700771; http://lattes.cnpq.br/6846637095187550O aprendizado por reforço é um conjunto de técnicas que permitem a um agente interagir com um determinado ambiente. Os agentes observam o estado do ambiente e executam uma ação, a ação é avaliada por meio de uma recompensa obtida. O agente tem como objetivo maximizar esta recompensa. Diversas questões como: locomoção em três dimensões e jogos eletrônicos foram abordados pelo aprendizado por reforço (KURACH et al., 2019). O treinamento de agentes para um jogo de futebol normalmente possui recompensas esparsas, o que retarda o aprendizado (MATIISEN et al., 2019). Uma técnica que pode contornar este obstaculo é o aprendizado por currículo proposto em (BENGIO et al., 2009). O aprendizado por currículo é uma técnica que aborda sub-tarefas mais simples da tarefa principal e aumenta gradativamente o nível de dificuldade ao longo do tempo. Neste trabalho apresentamos dois currículos, identificados como: 5-15-30-50 e 3-10-20-67, para o cenário Run to Score with Keeper da Football Academy. Mostramos que os currículos, em média, obtiveram melhores resultados se comparados ao treinamento apenas no cenário principal, sem currículo. O currículo 3-10-20-67 obteve um melhor resultado mesmo considerando o desvio padrão.
