Avaliação de métodos de imputação de valores ausentes para a predição de interações fármaco-proteína

Imagem de Miniatura

Data

2024-03-08

Título da Revista

ISSN da Revista

Título de Volume

Editor

Resumo

In the last decade, the study of pharmacological networks has received a lot of attention given its relevance drug discovery process. Many different approaches for predicting biological interactions have been proposed, especially in the area of multiple kernel learning (MKL). Such methods comprise integrative approaches that can handle heterogeneous data sources, but suffer from the missing data problem. Techniques to handle missing values in the base kernel matrices can be used, usually based on simple techniques, such as imputing zeroes, mean and median of the matrix. In this work, techniques for handling missing values were evaluated in the context of bipartite networks. Our analyzes showed that the, depending on the amount of missing data, k-NN and SVD technique performed much better than the other techniques, bringing encouraging results, while zero-fill showed the worst performance in relation to all other evaluated methods.

Descrição

Na última década, o estudo de redes farmacológicas tem recebido muita atenção devido à sua relevância no processo de descoberta de medicamentos. Muitas abordagens diferentes para prever interações biológicas têm sido propostas, especialmente na área de aprendizado de múltiplos kernels (MKL). Tais métodos compreendem abordagens integrativas que podem lidar com fontes de dados heterogêneas, mas sofrem com o problema de dados incompletos. Técnicas para lidar com valores faltosos nas matrizes kernel base podem ser utilizadas, geralmente baseadas em técnicas simples, como imputação de zeros, média e mediana da matriz. Neste trabalho, foram avaliadas técnicas de tratamento de valores faltosos no contexto de redes bipartidas. Nossas análises mostraram que, dependendo da quantidade de dados faltantes, a técnica k-NN e SVD teve um desempenho muito melhor do que as outras técnicas, trazendo resultados animadores, enquanto o preenchimento zero apresentou o pior desempenho em relação a todos os outros métodos avaliados

Palavras-chave

Aprendizado do computador, Interações fármaco-nutrientes, Proteínas, Dados biológicos, Multiple Kernel Learning

Referência

SANTOS, Victor Vidal dos. Avaliação de métodos de imputação de valores ausentes para a predição de interações fármaco-proteína. 2024. 26 f. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Departamento de Computação, Universidade Federal Rural de Pernambuco, Recife, 2024.

Avaliação

Revisão

Suplementado Por

Referenciado Por

Licença Creative Commons

Exceto quando indicado de outra forma, a licença deste item é descrita como openAccess