Skip to content

Latest commit

 

History

History
32 lines (24 loc) · 2.48 KB

README.md

File metadata and controls

32 lines (24 loc) · 2.48 KB

Modelos de aprendizaje automático para el diagnóstico no invasivo de la diabetes mellitus

Este repositorio contiene los notebooks de toda la experimentación desarrollada en el Trabajo Fin de Máster Modelos de aprendizaje automático para el diagnóstico no invasivo de la diabetes mellitus.

Organización del repositorio

En la carpeta datos se encuentran los ficheros Full statistics.xls (y su transformación a fichero .csv) y For LDA grapgh.xls obtenidos del trabajo de Dremin et al. (2017). Además, se encuentran los siguientes ficheros:

  • preprocesamiento_datos.ipynb: notebook con la carga inicial del dataset y su transformación para obtener un conjunto de datos con el que trabajar. Este conjunto de datos se almacena en el fichero datos.csv y se crea otra dataset con las clases en one-hot encoding, almacenado en el fichero datos_onehot.csv.
  • cargar_datos.ipynb y cargar_datos_onehot.ipynb son dos notebooks de prueba de carga de los dos conjuntos de datos creados anteriormente.
  • analisis_exploratorio.ipynb: notebook en el que se realiza el análisis exploratorio de los datos (EDA) del conjunto de datos datos.csv para entender cómo están distribuidos y familiarizarse un poco más con ellos. Tras las correcciones oportunas se obtiene el dataset filtrado con el que trabajarán los modelos. Este se almacena en datos_filtrados.csv.

En el directorio raíz se encuentran los notebooks de cada uno de los modelos creados y evaluados. Estos son:

Resultados obtenidos

A continuación se muestran las tablas comparativas de los resultados obtenidos en la evaluación de los modelos presentados.

Exactitud Sensibilidad Especificidad F1-score
Árboles de decisión 87.5% 90.74% 92.78% 90.39%
Random forest 79.17% 75.93% 87.22% 79.26%
kNN 70.83% 52.78% 81.11% 0%
Naive Bayes 83.33% 79.63% 90.63% 79.63%
SVM 87.5% 82.41% 92.78% 85.29%
Red neuronal 91.67% 93.52% 95% 93.52%