TCC - Bacharelado em Sistemas da Informação (Sede)

URI permanente para esta coleçãohttps://arandu.ufrpe.br/handle/123456789/427

Navegar

Resultados da Pesquisa

Agora exibindo 1 - 3 de 3
  • Imagem de Miniatura
    Item
    Análise de desempenho do Gemini na estimativa de peso de alimentos por imagem
    (2025-08-06) Silva, Carlos Gabriel Farias da; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587
    Com o avanço das inteligências artificiais multimodais, cresce o interesse em sua aplicação na área da saúde para facilitar a análise nutricional e auxiliar no combate à obesidade. No entanto, a confiabilidade desses modelos para identificar alimentos e estimar porções a partir de imagens ainda é incerta, sendo fundamental mensurar seu desempenho de forma objetiva. Este trabalho avalia a capacidade do modelo Gemini de classificar ingredientes e estimar seus respectivos pesos (em gramas) a partir de fotografias de refeições. Para isso, foi desenvolvido um sistema automatizado que envia requisições à API do Gemini, utilizando um prompt textual padronizado, elaborado com técnicas de engenharia de prompt, e uma lista de ingredientes de referência. As respostas do modelo, obtidas em formato JSON, foram comparadas com dados reais para análise de desempenho. Os resultados obtidos nos experimentos indicaram um baixo desempenho geral. Na classificação de ingredientes, o modelo apresentou baixa precisão e sensibilidade (recall), com dificuldade em detectar itens como temperos e condimentos (por exemplo, azeite e sal) que estavam misturados a outros alimentos, embora tenha obtido altas taxas de aceno para ingredientes visualmente distintos, como morangos e ovos mexidos. Na estimativa de peso, o desempenho também foi insatisfatório, com altos valores de erro (MAE e RMSE) e coeficiente de determinação (R2) negativo, evidenciando tendência à superestimação e desempenho inferior a uma simples predição pela média.
  • Imagem de Miniatura
    Item
    Avaliação de plataformas para o reconhecimento de placas veiculares brasileiras
    (2021-12-14) Amaral, Carlos Ivan Santos do; Garrozi, Cícero; http://lattes.cnpq.br/0488054917286587; http://lattes.cnpq.br/8099840025648951
    Com a crescente quantidade de veículos particulares no Brasil se faz cada vez mais necessário melhores métodos de gestão e fiscalização da frota veicular. As placas veiculares (PV) são objetos únicos e obrigatórios com o objetivo de identificar o veículo assim como seu proprietário. É recomendável que a coleta eficiente das informações presentes nas placas veiculares sejam realizadas por meio de sistemas automatizados para a detecção e reconhecimento de PV. Estes sistemas são fundamentais para se realizar a fiscalização e a gestão de diferentes atividades relacionadas ao tráfego de veículos. Neste sentido, este trabalho apresenta um estudo que identifica métodos de detecção e reconhecimento de PV com algoritmos baseados em aprendizagem de máquina. Para a produção desse experimento, sucedeu a coleta de um banco de imagens de veículos em praças de pedágio que estão localizadas no município de Cabo de Santo Agostinho - PE e fazem acesso ao Complexo Industrial Portuário Governador Eraldo Gueiros - SUAPE. O objetivo desse trabalho foi prover uma comparação entre o serviço de visão computacional da Microsoft Azure para detecção de objetos PV em conjunto com os serviços de Reconhecimento Óptico de Caracteres (Optical Character Recognition - OCR) da Google Vision com o algoritmo de Aprendizagem Profunda YOLO v4. O resultado do experimento expôs que em condições semelhantes de configurações em ambos dos modelos estudados, o YOLO v4 apresentou melhor desempenho, obtendo uma taxa de 92% de precisão na detecção e reconhecimento de placas veiculares.
  • Imagem de Miniatura
    Item
    Comparação de algoritmos de reconhecimento de gestos aplicados à sinais estáticos de Libras
    (2019-07-12) Cruz, Lisandra Sousa da; Cordeiro, Filipe Rolim; Macário Filho, Valmir; http://lattes.cnpq.br/4346898674852080; http://lattes.cnpq.br/4807739914511076; http://lattes.cnpq.br/2111589326272463
    A Língua Brasileira de Sinais (Libras) foi criada a fim de suprir uma necessidade de comunicação não-verbal para os surdos, que durante muito tempo foram doutrinados à ter o português como sua primeira língua. Atualmente, a Libras é a segunda língua oficial do Brasil e primeira língua dos surdos, assim como o português é para o ouvinte. Entretanto, mesmo com tamanho reconhecimento, a segunda língua oficial do Brasil não é conhecida pela maior parte da população brasileira. O processo de inclusão visa proporcionar igualdade aos deficientes, de forma que a deficiência não seja um fator impeditivo à convivência em sociedade. Com o advento da tecnologia e avanços da Inteligência Artificial (IA), foram criados artifícios tecnológicos visando propiciar inclusão. Na IA, o reconhecimento de padrões é um dos subtemas mais abordados na atualidade, sendo bastante aplicada para a classificação de gestos de diversas línguas de sinais na literatura. Essa pesquisa tem como principal tarefa identificar as mãos que formam um determinado sinal de Libras e em seguida reconhecer a que classe pertence, classificando-o. Baseado na classificação da Língua de Sinais Americana, a Feature Fusion-based Convolutional Neural Network (FFCNN), uma rede estendida da Convolutional Neural Network (CNN), obteve a melhor acurácia em comparação a outras redes, dentre elas a Visual Geometry Group (VGG). Diante desse cenário, esse trabalho aplica a FFCNN à gestos estáticos de Libras a fim de verificar se a FFCNN obtém a melhor acurácia assim como obteve na Língua de Sinais Americana. Para alcançar esse objetivo são comparados três classificadores: VGG com uma variação da CNN com 13 e 16 camadas; FFCNN e uma rede Multi Layer Perceptron (MLP) usada no reconhecimento de gestos estáticos de Libras na literatura. Os algoritmos foram aplicados em um dataset de Libras que contém 9.600 imagens de 40 sinais. Os resultados demonstram que a rede VGG com 16 camadas obteve a maior acurácia dentre modelos descritos neste trabalho, com valor de 99,45%.