Sampaio, PabloOliveira, Victor Gabriel Tenório2025-08-182025-03-24OLIVEIRA, Victor Gabriel Tenório. Application of a combined RL and PID algorithm in a mask controller for apnea. 2025. 17 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2025.https://arandu.ufrpe.br/handle/123456789/7530Este estudo investiga a integração do algoritmo Twin Delayed Deep Deterministic Policy Gradient (TD3) com o controle Proporcional-Integral-Derivativo (PID) para gerenciar sistemas não lineares, com foco no controle de Pressão Positiva Contínua nas Vias Aéreas (CPAP), buscando mostrar a viabilidade dessa integração. Um modelo matemático foi desenvolvido para representar a dinâmica do CPAP, e o algoritmo PIME-TD3 foi implementado e testado. Experimentos foram conduzidos nos ambientes Cascade Water Tank e CPAP, utilizando Optuna para otimizar hiperparâmetros. No ambiente Cascade Water Tank, o PIME-TD3 apresentou dificuldades em replicar os resultados da literatura, exigindo um ajuste exaustivo de hiperparâmetros e estrutura da rede. Já no ambiente CPAP, os resultados indicaram que as limitações da simulação impactaram o aprendizado, impedindo um controle eficaz da pressão. O estudo destaca a importância de modelos matemáticos realistas para treinar agentes de aprendizado por reforço e a necessidade de validação em hardware real para aplicação clínica. Além disso, sugere direções para pesquisas futuras, como a melhoria da modelagem do CPAP, experimentação com diferentes arquiteturas de rede e validação do controlador em dispositivos reais.17 f.pt-BRopenAccesshttp://creativecommons.org/licenses/by-nc-nd/4.0/Aprendizado por reforço profundoVias aéreas (Medicina)Equipamentos e provisõesInstrumentos e aparelhos médicosControladores PIDApneiaApplication of a combined RL and PID algorithm in a mask controller for apneabachelorThesisAttribution-NonCommercial-NoDerivatives 4.0 International