Este repositorio detalla los ejemplos prácticos mostrados en la charla "Utilizando técnicas de Machine Learning con datos abiertos". Pueden descargar la presentación de la charla en el siguiente link
El código presentado en la carpeta costa-rica se desarrolló en el marco de la competencia Kaggle Costa Rican Household Poverty Level Prediction. El código fue desarrollado por Will Koehrsen y en este repositorio hemos hecho una traducción y adaptación junto a Alejandra Neely.
Motivados por el código del caso de Costa Rica, se desarrolló con Alejandra Neely un ejemplo de predicción de niveles de notas basado en variables administrativas presentes en la ELPI. Para este caso se cuenta con un ejemplo de múltiples clases y otro de 2 clases.
Para correr los códigos de este repositorio se necesita:
Una vez que se cuenten con los requisitos es posible instalar los requerimientos de los notebooks y probar el código ejecutando los siguientes comandos en la terminal:
pip install pandas numpy matplotlib seaborn scikit-learn
jupyter notebook
Luego se les abrirá una ventana del navegador por defecto y podrán correr el código bloque por bloque.
También es posible probar el código utilizando la herramienta de Google llamada Colab. Básicamente la herramienta te permite trabajar con jupyter notebooks en la nube, sin necesidad de instalar nada en tu computador. Además, tiene la ventaja de poder trabajar colaborativamente de forma remota.
- Ingresar a https://colab.research.google.com/notebooks/
- Subir el notebook que se quiere revisar
- Subir los datos que utiliza el notebook
- Ejecutar los bloques de código
Google Colab se encargará de instalar los requerimientos necesarios para ejecutar el código.
Alejandra Neely |
Claudio Aracena |