Estadística AP I
1
Introducción a Estadística con R
1.1
Estadística: los fundamentos
1.1.1
Unidad de análisis
1.1.2
Tipos de variables y escalas de medición
1.2
R: los fundamentos
1.2.1
¿Por qué R?
1.2.2
POO
1.2.3
Los objetos
1.2.4
Los vectores
1.2.5
Los factores
1.2.6
Data frames
1.2.7
Índices
1.2.8
Nuestras herramientas: Paquetes y funciones
1.3
Importación y exploración de datos
1.3.1
Verificar el tipo de variable
2
Análisis exploratorio de datos
2.1
Estadísticos descriptivos
3
Visualización de datos con ggplot2
4
Introducción a la Estadística Inferencial I
4.1
Objetivo de la sesión
4.2
Fundamentos
4.2.1
Inferencia
4.2.2
La desviación estándar
4.2.3
Distribución normal
4.2.4
Teorema del límite central
4.2.5
Ley de los grandes números
4.2.6
Varias muestras
4.2.7
Error estándar
4.3
Métodos de estimación
4.3.1
Estimación puntual
4.3.2
Intervalo de confianza de una media
4.4
Ejercicio 1: ENADES 2022
4.4.1
Abrir base de datos
4.4.2
Identificar una variable numérica
4.4.3
Cálculo del estimador puntual
4.4.4
Cálculo del IC al 95%
4.4.5
Barras de error
5
IC para una media y una proporción, IC entre grupos
5.1
Objetivo de la sesión.
5.2
Índice Aditivo
5.3
Intervalos de confianza para grupos
5.4
Ejercicio 1
5.4.1
Pregunta de investigación
5.4.2
Creamos el índice aditivo
5.4.3
Cálculo del intervalo de confianza al 95%
5.4.4
IC para una media
5.4.5
IC para una media según grupos
5.4.6
Visualización
5.5
Ejercicio 2
5.6
Intervalo de una proporción
5.6.1
Definición
5.6.2
Fórmula
5.6.3
IC de proporción con la fórmula
5.6.4
IC de proporción con
prop.test()
5.6.5
IC de proporción según grupos
5.7
Ejercicio 3
6
Prueba de hipótesis: t.test y prop.test
6.1
Prueba de hipótesis
6.1.1
Paso 1: Establecer hipótesis
6.1.2
Paso 2: Verificar supuestos
6.1.3
Paso 3: Establecer nivel de significancia
6.1.4
Paso 4: Aplicar test estadístico y obtener p-value
6.1.5
Paso 5: Tomar una decisión
6.1.6
Paso 6: Interpretación
6.2
Tipos error posibles
6.3
Tipos de prueba de hipótesis
6.4
Diferencia de medias (t.test)
6.4.1
Pregunta de investigación
6.4.2
Paso 0: Análisis exploratorio de datos (EDA)
6.4.3
Paso 1: Establecer hipótesis
6.4.4
Paso 2: Verificar supuestos
6.4.5
Paso 3: Establecer nivel de significancia
6.4.6
Paso 4: Calcular estadístico de prueba y p-valor
6.4.7
Paso 5: Tomar una decisión
6.4.8
Paso 6: Interpretación
6.5
Ejercicio 1
6.6
Recuerda!
7
ANOVA: Comparación en más de dos muestras
7.1
Recordemos
7.1.1
Flujograma
7.1.2
Qué sigue?
7.2
ANOVA de un factor
7.2.1
Pregunta de investigación
7.2.2
Paso 0: Análisis exploratorio de datos (EDA)
7.2.3
Paso 1: Establecer hipótesis
7.2.4
Paso 2: Verificar supuestos
7.2.5
Paso 3: Establecer nivel de significancia
7.2.6
Paso 4: Calcular estadístico de prueba y p-valor
7.2.7
Paso 5: Tomar una decisión
7.2.8
Paso 6: Interpretación
7.3
Identificar el/los grupos diferentes
7.3.1
Pruebas post hoc: Test de Tukey
7.3.2
Visualización
7.4
Ejercicio 1
7.5
Ejercicio 2
8
Asociación de dos factores
8.1
Base de datos: LAPOP
8.2
Pregunta de investigaciòn
8.3
Preprocesamiento
8.4
Comparación clave
8.5
Tablas de contingencia
8.5.1
TC de frecuencias
8.5.2
TC de proporciones
8.5.3
Variable independiente y dependiente?
8.6
Gráficando: Barras y barras apiladas
8.7
Prueba χ²
8.7.1
Paso 0: Análisis exploratorio
8.7.2
Paso 1: Establecer hipótesis
8.7.3
Paso 2: Verificar supuestos
8.7.4
Paso 3: Establecer nivel de significancia
8.7.5
Paso 4: Calcular estadístico de prueba y p-valor
8.7.6
Paso 5: Tomar una decisión
8.7.7
Paso 6: Interpretación
8.8
Ahora hazlo tú!
9
Midiendo la asociación de dos numéricas: La Correlación
9.1
Objetivo de la sesión
9.2
Conceptos básicos
9.2.1
Plano cartesiano y diagrama de dispersión
9.2.2
Varianza
9.2.3
Covarianza
9.3
Coeficiente de Correlación de Pearson
9.3.1
Definición
9.3.2
Interpretación
9.4
Validación con prueba de hipótesis
9.4.1
Paso 1: Establecer hipótesis
9.4.2
Paso 2: Verificar supuestos
9.4.3
Paso 3: Establecer nivel de significancia
9.4.4
Paso 4: Calcular estadístico de prueba y p-valor
9.4.5
Paso 5: Tomar una decisión
9.4.6
Paso 6: Interpretación
9.5
Toma nota
9.5.1
Correlación no implica causalidad
9.5.2
Cuidado: Scatterplot como primer paso SIEMPRE
9.5.3
Valores extremos
9.5.4
Tamaño de la muestra
9.6
Ejercicio 1
9.7
Utilizando matrices
9.7.1
Matriz de scatterplot
9.7.2
Matriz de correlación
9.7.3
Graficando la matriz de correlación con
corrplot
9.8
Ejercicio 2
10
Regresión lineal simple: explicar y predecir
10.1
Objetivo de la sesión
10.2
Pregunta de investigación
10.3
Recordando
10.3.1
Coeficiente de Correlación de Pearson
10.3.2
¡Ahora hazlo tú!
10.4
Introducción a la Regresión Lineal Simple
10.4.1
Variable dependiente y variable independiente
10.4.2
Flashback: Ecuación de la recta
10.4.3
Regresión Lineal: La mejor recta para la nube de puntos
10.4.4
Calidad de ajuste: R2
10.4.5
Significancia estadística de los coeficientes
10.4.6
La RLS como herramienta predictiva
10.5
Ejercicio 1: Modelando la Matrícula escolar (RLS)
10.5.1
Paso 0: Identificar claramente la variable dependiente y la variable independiente
10.5.2
Paso 1: Explorar previamente la relación de las variables
10.5.3
Paso 2: Planteamos el modelo y verificamos si es válido con ANOVA
10.5.4
Paso 3: Nivel explicativo del modelo
10.5.5
Paso 4: La variable x aporta al modelo
10.5.6
Paso 5: Construimos la ecuación del modelo creado
10.6
Ejercicio 2
11
Regresión lineal múltiple: más de una independiente
11.1
Objetivo de la sesión
11.2
Regresión Lineal Múltiple
11.2.1
Ecuación
11.2.2
Mayor complejidad para visualizar la relación
11.3
Pregunta de investigación
11.4
Ejercicio 1: Explicando la desigualdad con RLM
11.4.1
Paso 0: Identificar claramente la variable dependiente y laS variables independientes
11.4.2
Paso 1: Explorar previamente la relación de las variables
11.4.3
Paso 2: ¿Nuestro modelo es válido?
11.4.4
Paso 3: ¿Qué tanto explica mi modelo?
11.4.5
Paso 4: ¿Las variables X aportan al modelo? ¿Cuál es la más importante?
11.4.6
Paso 5: ¿Cuál es la ecuación del modelo?
11.5
Tabla para comparar modelos (stargazer)
11.6
Ejercicio 2
12
Regresión lineal múltiple: elementos adicionales
12.1
Objetivo de la sesión
12.2
Identificar la variable que aporta más al modelo
12.2.1
El problema de la unidad de medida
12.2.2
Solución: Uso de coeficientes estandarizados
12.2.3
Ejercicio
12.3
Sobre variables categóricas en la RLM
12.3.1
Variables dummy (1-0): Definición
12.3.2
Variables dummy (1-0): Utilidad en la RLM
12.3.3
Ejercicio
13
Ejercicio de repaso
13.1
Situación
13.2
Pregunta 1
13.3
Pregunta 2
13.4
Pregunta 3
13.5
Planteamiento de conclusiones
Published with bookdown
Estadística para el Análisis Político I
Sesión 3
Visualización de datos con ggplot2