12  Repaso

Situación

Eres parte de un equipo de investigación que se ha enfocado en el estudio del lavado de activos, un fenómeno complejo y multifacético que afecta a la economía global.

El objetivo principal del proyecto es desarrollar un modelo predictivo que pueda explicar y prever las tendencias y patrones en el lavado de activos. Este modelo busca identificar los factores clave que contribuyen al lavado de activos, incluyendo variables económicas, políticas, sociales y tecnológicas.

Para ello se cuenta con la base de datos AML.xlsx.

Tip

Antes de pasar a las preguntas revisa la base de datos rápidamente, no debería tomarte más de 1 minuto. Ver cuántas filas tiene, cuántas columnas, darle un vistazo rápido al dataframe te darán una idea muy clara de con qué tipo de datos estás lidiando!

Pregunta 1

Antes de sumergirte en el modelado predictivo, es crucial realizar una exploración descriptiva exhaustiva de los datos que tu equipo ha compilado.

Esta base de datos incluye el índice de lavado de activos, junto con otros indicadores a nivel mundial, como el índice de criminalidad organizada, el índice de percepción de lavado de activos, el índice de democracia, y variables sociodemográficas como el nivel de pobreza y el gasto en educación. Esta fase exploratoria te permitirá comprender mejor las relaciones entre estas variables y cómo podrían influir en el fenómeno del lavado de activos.

  • Haz una tabla de los países de la región con su respectivo Índice de AML ordenado de mayor a menor.

  • Haz un gráfico de barras de la región con su respectivo Índice de AML ordenado de mayor a menor.

  • A nivel de la data, existe diferencia en el promedio del Índice AML a nivel de continente?

Tip

Recuerda que cuando realices un gráfico, puedes añadir algunas líneas de código para mejorar su presentación. Si tienes el código ordenado no te tomará mucho trabajo y mejorará totalmente la presentación de tu trabajo.

Pregunta 2

Ahora deberás verificar la significancia estadística de las relaciones entre la variable de interés (el índice de lavado de activos) y las otras variables. Para esto, se pueden emplear pruebas estadísticas como t.test y chi-cuadrado. Al menos uno de estos tests debe ser ejecutado para validar la relevancia de las relaciones observadas. Esta etapa es crucial para asegurar que las variables incluidas en el modelo final sean estadísticamente significativas.

  • Compara si existen diferencias entre el Índice AML entre países que tienen un nivel de pobreza alta o baja (cuando la pobreza es mayor a 40 la vamos a considerar alta).

  • Convierte el AML Index en categórica. Identifica si existe asociación entre este y el régimen en el que se encuentran (Índice de la Democracia).

Tip

Cuidado con el preprocesamiento y la creación de variables. También ten en cuenta las hipótesis nula y alternativa de cada test estadístico.

Pregunta 3

Finalmente, el paso siguiente es desarrollar y comparar modelos de regresión lineal múltiple. Esta comparación te permitirá evaluar cuál modelo es el más adecuado y efectivo para predecir el lavado de activos. Con estos resultados, estarás listo para presentar tus hallazgos y recomendaciones al comité de investigación, destacando cuál modelo consideras que es el mejor basado en tu análisis estadístico y exploratorio.

  • Identifica con qué variables existen mayor correlación. Puedes hacerlo por cada pareja o a nivel de matriz.

  • Genera un modelo de regresión lineal simple con la variable que tenga mayor correlación.

Tip

Ten cuidado con la notación científica y mira la escala de las variables que estás utilizando. Asimismo, recuerda el flujograma que trabajamos con cada uno de sus pasos.

Conclusiones

Qué concluyes de este ejercicio y qué sugerirías al grupo de investigación?

Tip

Más allá de la mera presentación de valores estadísticos como el p-valor o de cifras específicas, lo esencial es extraer un enunciado o idea concluyente que aporte valor significativo. La conclusión no es simplemente el final de un análisis; es el punto donde la investigación trasciende los datos y se transforma en conocimiento aplicable.