class: front <!--- Para correr en ATOM - open terminal, abrir R (simplemente, R y enter) - rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader') About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio. ---> .pull-left[ # Métodos estadísticos para Ciencias Sociales III ## **Kevin Carrasco** ## Sociología - UNAB ## 2do semestre 2025 ## .green[[metod3-unab.netlify.app](metod3-unab.netlify.app)] ] .pull-right[ .right[ <br> ## .yellow[Sesión 6: Regresión múltiple y estimación de valores predichos]  ] ] --- layout: true class: animated, fadeIn --- class: inverse, bottom, right, animated, slideInRight # .red[Sesión 6] <br> Repaso sesión anterior Estimación de valores predichos <br> <br> <br> <br> --- class: inverse, bottom, right # .red[Sesión 6] <br> .yellow[Repaso sesión anterior] Estimación de valores predichos <br> <br> <br> <br> --- # Regresión simple vs múltiple .small[ ] .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <caption> </caption> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> <th style="padding-left: 5px;padding-right: 5px;">Model 2</th> <th style="padding-left: 5px;padding-right: 5px;">Model 3</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">-91566.27</td> <td style="padding-left: 5px;padding-right: 5px;">93442.62</td> <td style="padding-left: 5px;padding-right: 5px;">-270638.30</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(183509.80)</td> <td style="padding-left: 5px;padding-right: 5px;">(302389.31)</td> <td style="padding-left: 5px;padding-right: 5px;">(241882.27)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">educ</td> <td style="padding-left: 5px;padding-right: 5px;">150401.61<sup>**</sup></td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(43618.69)</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(44602.35)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">intelig</td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">174590.16</td> <td style="padding-left: 5px;padding-right: 5px;">100425.53</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(124491.71)</td> <td style="padding-left: 5px;padding-right: 5px;">(90114.05)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.60</td> <td style="padding-left: 5px;padding-right: 5px;">0.20</td> <td style="padding-left: 5px;padding-right: 5px;">0.66</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.55</td> <td style="padding-left: 5px;padding-right: 5px;">0.10</td> <td style="padding-left: 5px;padding-right: 5px;">0.56</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> <td style="padding-left: 5px;padding-right: 5px;">10</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="4"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] --- # Parcialización _¿Cómo se despeja la regresión de `\(Y\)` en `\(X_1\)` del efecto de `\(X_2\)`?_ .pull-left[ .center[] ] -- .pull-right[ .center[] ] --- .pull-left[ # Parcialización .medium[ ¿Como obtenemos una variable `\(X_1\)` parcializada de `\(X_2\)`? ] .center[ ] ] -- .pull-right[ <br> <br> .medium[ - Pensemos en que `\(X_1\)` parcializada (de `\(X_2\)` ) es todo lo de `\(X_1\)` (varianza) que no tiene que ver con `\(X_2\)` - En otras palabras, en un modelo donde `\(X_1\)` es la variable dependiente y `\(X_2\)` la independiente, `\(X_1\)` parcializada equivale al **residuo** de esta regresión ] ] --- class: inverse ## RESUMEN - Si hay correlación entre predictores, el valor de los coeficientes de regresión será **distinto** en modelos simples y en modelos múltiples - Esta diferencia se relaciona con el concepto de **parcialización**: se extrae la varianza común entre predictores - La parcialización permite el **control estadístico**: *limpiar* o despejar los efectos de la influencia de otras variables --- ### ejemplo .small[ | Caso | X (años educación) | Y (nivel de ingresos) | X - X̄ | Y - Ȳ | (X - X̄) * (Y - Ȳ) | (X - X̄)² | |---------|---------------------|--------------------------|--------|--------|--------------------|------------| | Caso 1 | 1 | 250 | | | | | | Caso 2 | 2 | 200 | | | | | | Caso 3 | 3 | 250 | | | | | | Caso 4 | 4 | 300 | | | | | | Caso 5 | 5 | 400 | | | | | | Caso 6 | 6 | 350 | | | | | | Caso 7 | 7 | 400 | | | | | | Caso 8 | 8 | 350 | | | | | | **Promedios / Sumas** | **X̄ = **| **Ȳ = ** | | | **Σ = ** | **Σ = ** | ] --- ### Otro ejemplo .small[ | Caso | X (años educación) | Y (nivel de ingresos) | X - X̄ | Y - Ȳ | (X - X̄) * (Y - Ȳ) | (X - X̄)² | |---------|---------------------|--------------------------|--------|--------|--------------------|------------| | Caso 1 | 1 | 250 | -3.5 | -62.5 | 218.75 | 12.25 | | Caso 2 | 2 | 200 | -2.5 | -112.5 | 281.25 | 6.25 | | Caso 3 | 3 | 250 | -1.5 | -62.5 | 93.75 | 2.25 | | Caso 4 | 4 | 300 | -0.5 | -12.5 | 6.25 | 0.25 | | Caso 5 | 5 | 400 | 0.5 | 87.5 | 43.75 | 0.25 | | Caso 6 | 6 | 350 | 1.5 | 37.5 | 56.25 | 2.25 | | Caso 7 | 7 | 400 | 2.5 | 87.5 | 218.75 | 6.25 | | Caso 8 | 8 | 350 | 3.5 | 37.5 | 131.25 | 12.25 | | **Promedios / Sumas** | **X̄ = 4.5**| **Ȳ = 312.5** | | | **Σ = 1050** | **Σ = 42** | ] --- ### Cálculo de coeficiente de regresión `$$b_{1}=\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})}=\frac{1050} {42}=25$$` --- ### Estimación de los coeficientes de la ecuación: `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=b_{0}+25\bar{X}$$` Despejando el valor de `\(b_{0}\)` `$$b_{0}=312.5-25*4.5=200$$` - Una propiedad de la recta de regresión es que siempre pasa por las coordenadas X̄Ȳ. Esto es, pasa por los valores promedios de X e Y --- class: inverse ## Hasta ahora deberíamos saber: -- 1- Modelo de regresión como una **representación simplificada** de la relación compleja entre variables -- 2- El `\(\beta\)` de regresión nos dice **cuanto aumenta `\(Y\)` ** (variable dependiente) *en promedio* por ** cada punto que aumenta** `\(X\)` (variable independiente). -- 3- El modelo nos permite **estimar** el puntaje de `\(Y\)` para cada valor de `\(X\)` --- # ¿Qué tan bueno es nuestro modelo? - El cálculo del `\(\beta\)` busca minimizar los residuos (de ahí "mínimos cuadrados ordinarios") - Una vez minimizados los residuos, se puede evaluar el ajuste - qué tan bien representa nuestro modelo la realidad - cuánto error (de predicción) estamos cometiendo con nuestro modelo --- class: inverse, right ## Un modelo es mejor mientras **mejor refleje** lo que sucede con los datos -- ## En otras palabras, cuando se parece o **ajusta** mejor a los datos -- ## ... y en otras: cuando los **residuos** son menores --- # Varianza explicada de Y ¿Qué parte de la varianza de ingreso (Y) se asocia a educación? .center[] --- # Varianza explicada de Y: `\(R^2\)` - ¿Cuánto de los ingresos puedo predecir con educación (regresión) y cuánto me estoy equivocando (residuos)? -- - el `\(R^2\)` - es la proporción de la varianza de Y que se asocia a X - varía entre 0 y 1, y se puede expresar en porcentaje -- - Entonces, podemos descomponer la varianza de Y en 2: aquella asociada a X (regresión) y la que no se asocia a X (residuos) --- # Inferencia: la otra mitad de la regresión - hasta ahora hemos interpretado solo la magnitud de los `\(\beta\)` de regresión. Pero, - ¿son estos `\(\beta\)` **_estadísticamente_** significativos? - es algo que podemos extrapolar de nuestra muestra a la población? - ... o es algo que se debe simplemente al azar? --- # Bases de inferencia: - dispersión: varianza y desviación estandar - curva normal - error estándar --- # Inferencia y significación estadística - ¿Con qué nivel de **probabilidad** estamos dispuest_s a aceptar que las diferencias (entre promedios) son distintas de 0? - Por convención, una probabilidad de error (o valor *p*) de menos de 0.05 (1 de 20 veces) - Esto significa una probabilidad de acierto/nivel de confianza de 95% (2 SE) --- .center[] --- ## Volviendo a regresión - el error estándar del promedio nos sirve como referencia cálculo de significación estadística de los coeficientes de regresión -- - en regresión, las variables independientes poseen distintos niveles/valores, y queremos saber si las diferencias en Y de los valores de X son significativas = **estadísticamente distintas de 0**. - Ej: diferencias de ingreso (Y) entre hombres y mujeres (X) --- # Inferencia y prueba de hipótesis - La hipótesis nula (o `\(H_0\)` ) se refiere a que las diferencias son = 0 - En regresión, `\(H_0\)` dice que nuestro beta no es distinto de cero - Por eso, queremos rechazar `\(H_0\)` y para eso tenemos que establecer un nivel de probabilidad aceptable (al menos p<0.05) --- ## Prueba de hipótesis en regresión Contrastamos la *hipótesis nula* (no hay asociación entre el predictor y la variable dependiente): `$$H_{0}: \beta_{j} = 0$$` En relación a la siguiente hipótesis alternativa: `$$H_{a}: \beta_{j} \neq 0$$` --- # Prueba T - para **mayor precisión**, la prueba T nos permite establecer el nivel de error que estamos cometiendo al rechazar `\(H_0\)` - para ello, T se ajusta por la cantidad de sujetos en la muestra (N), pero para un N>120 se aproxima a la distribución normal. --- # Valor crítico de T  --- class: inverse ## Resumen: inferencia en regresión - conceptos centrales: error estándar del `\(\beta\)` y **valor T** - el valor T se obtiene dividiendo el beta por el error estándar - para muestras grandes, un T > 1.96 permite rechazar `\(H_0\)` a un p<0.05, y T > 2.58 a un p>0.01 --- class: roja, bottom, right, slideInRight # 4. Tabla de regresión --- ## Reporte de regresión múltiple - en ocasiones se representa el modelo como una ecuación (opcional), y los resultados en una Tabla de Regresión - la tabla posee ciertas características y contenidos mínimos que deben ser considerados en el reporte - en R es posible automatizar el reporte en tablas, pero hay que agregar especificaciones para una visualización adecuada --- .pull-left-narrow[ # Tabla de regresión ## con sjPlot ] .pull-right-wide[ .smally[ <table style="border-collapse:collapse; border:none;"> <caption style="font-weight: bold; text-align:left;">Modelos de regresión para puntaje en ciencia <br> (Errores estándar entre paréntesis)</caption> <tr> <th style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; text-align:left; "> </th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 1</th> <th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 2</th> </tr> <tr> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; text-align:left; ">Predictores</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> <td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal; ">β</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">(Intercept)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">11.616 <sup>***</sup><br>(3.054)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">12.325 <sup>***</sup><br>(3.194)</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">matematicas</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.402 <sup>***</sup><br>(0.073)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.389 <sup>***</sup><br>(0.074)</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">lectura</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.365 <sup>***</sup><br>(0.066)</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.335 <sup>***</sup><br>(0.073)</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">mujer</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">-2.010 <sup></sup><br>(1.023)</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">status</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; "></td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center; ">0.050 <sup></sup><br>(0.062)</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm; border-top:1px solid;">Observations</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">200</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">200</td> </tr> <tr> <td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm;">R<sup>2</sup> / R<sup>2</sup> adjusted</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.478 / 0.473</td> <td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.489 / 0.479</td> </tr> <tr> <td colspan="3" style="font-style:italic; border-top:double black; text-align:right;">* p<0.05 ** p<0.01 *** p<0.001</td> </tr> </table> ]] ---  --- ## Beta estandarizado o no estandarizado - Betas: - pueden aparecer en puntaje bruto (no estandarizado) o estandarizado - beta estandarizado: se interpreta como cuantas unidades de desviación estándar aumenta Y por cada aumento de una desviación estándar de X - betas estandarizados permiten comparar el efecto de cada variable independiente en una misma escala (desviaciones estándar) --- class: inverse, bottom, right # .red[Sesión 5] <br> Repaso sesión anterior .yellow[estimación de valores predichos] --- ## ¿Cuáles son los objetivos de un modelo de regresión? -- * Es un modelo estadístico que se usa para: - **Conocer**: La relación de una variable dependiente de acuerdo a una/otras independiente(s) - **Predecir**: Estimar el valor de una variable dependiente de acuerdo al valor de otras - **Inferir**: si estas relaciones son estadísticamente significativas --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ ``` ## Educacion Ingreso ## 1 1 250 ## 2 2 240 ## 3 3 230 ## 4 4 220 ## 5 5 300 ## 6 6 380 ## 7 7 450 ## 8 8 520 ``` ] --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ .pull-right-wide[] ] --- .pull-left-narrow[ ### Ejemplo ] .pull-right-wide[ .pull-right-wide[] ] --- ### La recta de regresión `$$\widehat{Y}=b_{0} +b_{1}X$$` .small[ Donde - `\(\widehat{Y}\)` es el valor estimado de `\(Y\)` (que se puede predecir) - `\(b_{0}\)` es el intercepto de la recta - el valor de Y cuando X es 0 - Debido a que es una estimación, es común que sea un valor sin sentido analítico (incluso negativo) - `\(b_{1}\)` es el coeficiente de regresión (pendiente de la recta), que nos dice cuánto aumenta Y por cada punto que aumenta X ] --- ### Estimación de los coeficientes de la ecuación: `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=b_{0}+25\bar{X}$$` Despejando el valor de `\(b_{0}\)` `$$b_{0}=200-0\bar{X}$$` --- .pull-left-narrow[ ### Ejemplo *Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades* ] .pull-right-wide[ ] --- ¿y la interpretación para variables categóricas? .pull-left[ .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Intercepto</td> <td style="padding-left: 5px;padding-right: 5px;">245.00<sup>**</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(51.74)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación media</td> <td style="padding-left: 5px;padding-right: 5px;">-20.00</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(73.18)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación superior</td> <td style="padding-left: 5px;padding-right: 5px;">167.50<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(63.37)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.70</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.58</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] ] -- .pull-right[ *Las personas que tienen educación superior ganan $167.5mil más en comparación con quienes tienen educación básica, efecto que es estadísticamente significativo (p<0.05)* ] --- ¿Cómo podemos predecir el valor esperado de una variable para una persona en particular? .pull-left-narrow[ .small[ <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Intercepto</td> <td style="padding-left: 5px;padding-right: 5px;">245.00<sup>**</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(51.74)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación media</td> <td style="padding-left: 5px;padding-right: 5px;">-20.00</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(73.18)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Educación superior</td> <td style="padding-left: 5px;padding-right: 5px;">167.50<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(63.37)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.70</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.58</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> ] ] .pull-right-wide[ `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=245+b_{1}\bar{X}$$` ¿Si una persona tuviera un nivel de educación superior? `$$\bar{Y}=245+167.5$$` `$$\bar{Y}=412.5$$` ] --- .pull-left-narrow[ ## Graficando ] .pull-right-wide[  ] --- ## Variables numéricas <table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;"> <thead> <tr> <th style="padding-left: 5px;padding-right: 5px;"> </th> <th style="padding-left: 5px;padding-right: 5px;">Model 1</th> </tr> </thead> <tbody> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td> <td style="padding-left: 5px;padding-right: 5px;">52.51</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(81.44)</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">edad</td> <td style="padding-left: 5px;padding-right: 5px;">7.89<sup>*</sup></td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;"> </td> <td style="padding-left: 5px;padding-right: 5px;">(2.26)</td> </tr> <tr style="border-top: 1px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.67</td> </tr> <tr> <td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td> <td style="padding-left: 5px;padding-right: 5px;">0.62</td> </tr> <tr style="border-bottom: 2px solid #000000;"> <td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td> <td style="padding-left: 5px;padding-right: 5px;">8</td> </tr> </tbody> <tfoot> <tr> <td style="font-size: 0.8em;" colspan="2"><sup>***</sup>p < 0.001; <sup>**</sup>p < 0.01; <sup>*</sup>p < 0.05</td> </tr> </tfoot> </table> --- .pull-left[  ] .pull-right[ `$$\bar{Y}=b_{0}+b_{1}\bar{X}$$` Reemplazando: `$$\bar{Y}=52.51+b_{1}*7.89$$` ¿Una persona de edad 40? `$$\bar{Y}=52.51+40*7.89$$` `$$\bar{Y}=368.11$$` ] --- ## Tips para la prueba - Definiciones de conceptos clave: ¿Qué es el coeficiente de regresión? ¿Qué es parcialización? ¿Qué es el intercepto? - Estimación (cálculo) del coeficiente de regresión - Interpretación de tabla de regresión (intercepto, coeficientes de regresión, inferencia, control estadístico, R2) --- ### Ejemplos para estimar el coeficiente de regresión .small[ | Caso | X | Y | X - X̄ | Y - Ȳ | (X - X̄) * (Y - Ȳ) | (X - X̄)² | | --------------------- | ---------- | --------- | ------ | ----- | ------------------- | ---------- | | Caso 1 | 1 | 2 | -2 | -4 | 8 | 4 | | Caso 2 | 2 | 4 | -1 | -2 | 2 | 1 | | Caso 3 | 3 | 6 | 0 | 0 | 0 | 0 | | Caso 4 | 4 | 8 | 1 | 2 | 2 | 1 | | Caso 5 | 5 | 10 | 2 | 4 | 8 | 4 | | **Promedios / Sumas** | **X̄ = 3** | **Ȳ = 6** | | | **Σ = 20** | **Σ = 10** | ] Y = 0 + 2X --- ### Ejemplos para estimar el coeficiente de regresión .small[ | Caso | X | Y | X - X̄ | Y - Ȳ | (X - X̄) \* (Y - Ȳ) | (X - X̄)² | | --------------------- | ---------- | --------- | ------ | ----- | ------------------- | ---------- | | Caso 1 | 1 | 3 | -2 | -6 | 12 | 4 | | Caso 2 | 2 | 6 | -1 | -3 | 3 | 1 | | Caso 3 | 3 | 9 | 0 | 0 | 0 | 0 | | Caso 4 | 4 | 12 | 1 | 3 | 3 | 1 | | Caso 5 | 5 | 15 | 2 | 6 | 12 | 4 | | **Promedios / Sumas** | **X̄ = 3** | **Ȳ = 9** | | | **Σ = 30** | **Σ = 10** | Y = 0 + 3X ] --- ### Ejemplos para estimar el coeficiente de regresión .small[ | Caso | X | Y | X - X̄ | Y - Ȳ | (X - X̄)(Y - Ȳ) | (X - X̄)² | | --------------------- | ---------- | ---------- | ------ | ----- | --------------- | ---------- | | Caso 1 | 0 | 5 | -2 | -6 | 12 | 4 | | Caso 2 | 1 | 8 | -1 | -3 | 3 | 1 | | Caso 3 | 2 | 11 | 0 | 0 | 0 | 0 | | Caso 4 | 3 | 14 | 1 | 3 | 3 | 1 | | Caso 5 | 4 | 17 | 2 | 6 | 12 | 4 | | **Promedios / Sumas** | **X̄ = 2** | **Ȳ = 11** | | | **Σ = 30** | **Σ = 10** | Y = 5 + 3X ] --- ### Regresión lineal con variable dependiente participación en protestas .small[ | Variable | Std(B) | IC. 95% | |--------------------------------------------------------------------------|---------|------------------| | Ingreso mensual del hogar | .175*** | [.117, .232] | | Satisfacción con situación económica del país | -.131** | [-.191, -.071] | | Identificación política de izquierda (ref. Distinto de izquierda) | .150*** | [.091, .209] | | Identificación con causas sociales | .233*** | [.172, .294] | | Participación en organizaciones | .270*** | [.214, .326] | | Edad | .076* | [.017, .135] | | Nivel educacional | .073* | [.008, .138] | | | | | | R² | .269 | | | n | 930 | | | | |*p < .05, **p < .01, ***p < .001*| ] --- ### Regresión lineal con variable dependiente Satisfacción con la democracia [https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543](https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543) - Revisar sección resultados (página 43 en adelante) --- class: front .pull-left[ # Métodos estadísticos para ciencias sociales III ## **Kevin Carrasco** ## Sociología - UNAB ## 2do Semestre 2025 ## .green[[metod3-unab.netlify.com](metod3-unab.netlify.com)] ] .pull-right[ .right[ <br> ## .yellow[Sesión 6: Regresión múltiple y estimación de valores predichos]  ] ]