¿Qué efecto tiene el manejo de variables faltantes en la incertidumbre predictiva?

Resumen:

La incertidumbre predictiva cuantifica la falta de confianza en las predicciones de un modelo. Estimarla apropiadamente es valioso en dominios con decisiones riesgosas. Por ejemplo, en predicción de mortalidad o diagnóstico de cáncer.

En estos contextos es común tomar decisiones sobre datos con variables faltantes, que generalmente son rellenados durante una fase de preprocesamiento. Sin embargo, como el relleno es considerado preprocesamiento, la comunidad de Machine Learning no ha explorado el impacto que diferentes estrategias de relleno tengan sobre la incertidumbre predictiva. Esta exploración puede guiarnos a estrategias que reduzcan falsos positivos o falsos negativos, mitigando así daños en decisiones riesgosas (un falso negativo en pacientes con cáncer). En esta investigación se analiza experimentalmente, el impacto que tienen tres estrategias recientes para rellenar valores faltantes, sobre la incertidumbre predictiva de un conjunto de redes neuronales.

Expositor:

Juan José García Cedeño se graduó de Ingeniero en Ciencias de la Computación de la ESPOL; durante su carrera de pregrado cursó un semestre en la Universidad de Johns Hopkins en donde trabajó en el laboratorio de visión, dinámica y aprendizaje, actualmente es estudiante doctoral en la Universidad de Carolina del Norte en Chapel Hill, en donde está trabajando en mejorar la incertidumbre de los algoritmos de aprendizaje de máquina.

Grabación