Análisis de los factores asociados a la felicidad utilizando técnicas de Machine Learning
DOI:
https://doi.org/10.71701/5bnqv178Palabras clave:
Felicidad, Machine Learning, limpieza e imputación de datos, clasificación, árboles de decisión, modelos ensamblados, clusteringResumen
El estudio tiene por objetivo identificar la importancia de los factores asociados a la felicidad y encontrar patrones en la evolución de los países que participan en el informe mundial anual de la felicidad de Gallup utilizando técnicas de Machine Learning. Metodológicamente, la investigación fue de tipo aplicada, de nivel explicativo y de diseño no experimental longitudinal (2008-2022). La metodología de trabajo utilizada es CRISP-DM (Cross Industry Standard-Data Mining). En la imputación de datos faltantes, se utilizaron técnicas de series de tiempo, asumiendo que cada factor para un determinado país era una serie de tiempo univariada. Para identificar la importancia de los factores asociados a la felicidad, se generó la variable dependiente nivel de felicidad a partir de la variable continua felicidad y se propusieron tres niveles: alto, medio y bajo. Durante el análisis exploratorio de datos, se encontró que los países con nivel alto de felicidad son más sensibles a los factores bajo estudio. La aplicación de técnicas basadas en árboles de decisión para clasificación obtuvo un accuracy promedio de 0.80 y que las variables eran significativas; las tres principales ordenadas por importancia para explicar el nivel de felicidad eran: PBI per cápita, esperanza de vida al nacer y red de apoyo. Estos resultados coinciden con la regresión por mínimos cuadrados con efectos fijos planteada por Gallup, salvo en el orden del segundo y tercer factor. Respecto a los patrones en la evolución de la variable felicidad, se seleccionaron a los países que participaron en los últimos diez años; se aplicaron diversas técnicas para determinar el número de conglomerados y se establecieron cuatro grupos para el análisis de clustering, los resultados muestran que los primeros tres grupos mantienen o mejoran su nivel de felicidad en tanto que el cuarto grupo lo desmejora.
Descargas
Referencias
Real Academia Española. (s. f.). Felicidad. En Diccionario de la lengua española. Recuperado de https://dle.rae.es/felicidad?m=form
Lopez Otin, C. (2019). La vida en cuatro letras. Paidós.
Neira, H. (2012). ¿Qué es república? Fondo Editorial Universidad San Martín de Porres.
Waldinger Robert, S. M. (2023). The Good Life. Simon & Schuster.
Helliwell, J. F. (2023). World Hapiness Report 2023. Recuperado de https://worldhappiness.report/
Chollet, F., y Allaire, J. (2017). Deep Learning wih R. Manning Publications.
Aldas, J., y Uriel, E. (2017). Análisis multivariante aplicado con R. Paraninfo.
Lantz, B. (2019). Machine Learning with R Expert techniques for predictive modeling. Packt.
Zumel, N., y Mount, J. (2020). Practical data science with R. New York. Manning Publications.
Chapman, P. C. (2000). CRISP-DM 1.0 Step-by-step data mining guide. CRISP-DM consortium.
Descargas
Publicado
Número
Sección
Licencia
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial 4.0.