Métodos estadísticos para Ciencias Sociales III

<!---
Para correr en ATOM
- open terminal, abrir R (simplemente, R y enter)
- rmarkdown::render('static/docpres/07_interacciones/7interacciones.Rmd', 'xaringan::moon_reader')

About macros.js: permite escalar las imágenes como [scale 50%](path to image), hay si que grabar ese archivo js en el directorio.
--->

.pull-left[
# Métodos estadísticos para Ciencias Sociales III
## **Kevin Carrasco**
## Sociología - UNAB
## 2do semestre 2025
## .green[[metod3-unab.netlify.app](metod3-unab.netlify.app)] 
]

.pull-right[
.right[
<br>
## .yellow[Sesión 6: Regresión múltiple y estimación de valores predichos]
![:scale 70%](../../files/img/eval-hires.png)

]

]
---

---
class: inverse, bottom, right, animated, slideInRight

# .red[Sesión 6]
<br>

Repaso sesión anterior

Estimación de valores predichos

<br>
<br>
<br>
<br>
---
class: inverse, bottom, right

# .red[Sesión 6]
<br>

Estimación de valores predichos

---
# Regresión simple vs múltiple

]
.small[
<table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;">
<caption> </caption>
<thead>
<tr>
<th style="padding-left: 5px;padding-right: 5px;">&nbsp;</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 1</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 2</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 3</th>
</tr>
</thead>
<tbody>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td>
<td style="padding-left: 5px;padding-right: 5px;">-91566.27</td>
<td style="padding-left: 5px;padding-right: 5px;">93442.62</td>
<td style="padding-left: 5px;padding-right: 5px;">-270638.30</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(183509.80)</td>
<td style="padding-left: 5px;padding-right: 5px;">(302389.31)</td>
<td style="padding-left: 5px;padding-right: 5px;">(241882.27)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">educ</td>
<td style="padding-left: 5px;padding-right: 5px;">150401.61<sup>&#42;&#42;</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">137092.20<sup>&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(43618.69)</td>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(44602.35)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">intelig</td>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">174590.16</td>
<td style="padding-left: 5px;padding-right: 5px;">100425.53</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(124491.71)</td>
<td style="padding-left: 5px;padding-right: 5px;">(90114.05)</td>
</tr>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.60</td>
<td style="padding-left: 5px;padding-right: 5px;">0.20</td>
<td style="padding-left: 5px;padding-right: 5px;">0.66</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.55</td>
<td style="padding-left: 5px;padding-right: 5px;">0.10</td>
<td style="padding-left: 5px;padding-right: 5px;">0.56</td>
</tr>
<tr style="border-bottom: 2px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td>
<td style="padding-left: 5px;padding-right: 5px;">10</td>
<td style="padding-left: 5px;padding-right: 5px;">10</td>
<td style="padding-left: 5px;padding-right: 5px;">10</td>
</tr>
</tbody>
<tfoot>
<tr>
<td style="font-size: 0.8em;" colspan="4"><sup>&#42;&#42;&#42;</sup>p &lt; 0.001; <sup>&#42;&#42;</sup>p &lt; 0.01; <sup>&#42;</sup>p &lt; 0.05</td>
</tr>
</tfoot>
</table>
]

---
# Parcialización

_¿Cómo se despeja la regresión de `$Y$` en `$X_1$` del efecto de `$X_2$`?_

---
.pull-left[
# Parcialización

.medium[
- Pensemos en que `$X_1$` parcializada (de `$X_2$` ) es todo lo de `$X_1$` (varianza) que no tiene que ver con `$X_2$`

- En otras palabras, en un modelo donde `$X_1$` es la variable dependiente y `$X_2$` la independiente, `$X_1$` parcializada equivale al **residuo** de esta regresión
]
]

---
class: inverse

## RESUMEN

- Si hay correlación entre predictores, el valor de los coeficientes de regresión será **distinto** en modelos simples y en modelos múltiples

- Esta diferencia se relaciona con el concepto de  **parcialización**: se extrae la varianza común entre predictores

- La parcialización permite el **control estadístico**: *limpiar* o despejar los efectos de la influencia de otras variables

---

### ejemplo
.small[

| Caso    | X (años educación)  | Y (nivel de ingresos)    | X - X̄ | Y - Ȳ  | (X - X̄) * (Y - Ȳ) |  (X - X̄)² |
|---------|---------------------|--------------------------|--------|--------|--------------------|------------|
| Caso 1  | 1                   | 250                      |    |   |              |     |
| Caso 2  | 2                   | 200                      |    |  |              |        |
| Caso 3  | 3                   | 250                      |    |   |              |        |
| Caso 4  | 4                   | 300                      |    |   |               |        |
| Caso 5  | 5                   | 400                      |    |    |               |        |
| Caso 6  | 6                   | 350                      |     |   |               |        |
| Caso 7  | 7                   | 400                      |     |    |              |        |
| Caso 8  | 8                   | 350                      |     |    |              |       |
| **Promedios / Sumas** | **X̄ = **| **Ȳ = **      |        |        | **Σ = **       | **Σ = ** |

]

---

### Otro ejemplo
.small[

| Caso    | X (años educación)  | Y (nivel de ingresos)    | X - X̄ | Y - Ȳ  | (X - X̄) * (Y - Ȳ) |  (X - X̄)² |
|---------|---------------------|--------------------------|--------|--------|--------------------|------------|
| Caso 1  | 1                   | 250                      | -3.5   | -62.5  | 218.75             | 12.25      |
| Caso 2  | 2                   | 200                      | -2.5   | -112.5 | 281.25             | 6.25       |
| Caso 3  | 3                   | 250                      | -1.5   | -62.5  | 93.75              | 2.25       |
| Caso 4  | 4                   | 300                      | -0.5   | -12.5  | 6.25               | 0.25       |
| Caso 5  | 5                   | 400                      | 0.5    | 87.5   | 43.75              | 0.25       |
| Caso 6  | 6                   | 350                      | 1.5    | 37.5   | 56.25              | 2.25       |
| Caso 7  | 7                   | 400                      | 2.5    | 87.5   | 218.75             | 6.25       |
| Caso 8  | 8                   | 350                      | 3.5    | 37.5   | 131.25             | 12.25      |
| **Promedios / Sumas** | **X̄ = 4.5**| **Ȳ = 312.5**      |        |        | **Σ = 1050**       | **Σ = 42** |

]
---

### Cálculo de coeficiente de regresión

`$$b_{1}=\frac{\sum_{i=1}^{n}(x_i - \bar{x})(y_i - \bar{y})} {\sum_{i=1}^{n}(x_i - \bar{x})(x_i - \bar{x})}=\frac{1050} {42}=25$$`

---
### Estimación de los coeficientes de la ecuación:

`$$\bar{Y}=b_{0}+b_{1}\bar{X}$$`
Reemplazando:

`$$\bar{Y}=b_{0}+25\bar{X}$$`

Despejando el valor de `$b_{0}$`

`$$b_{0}=312.5-25*4.5=200$$`
  - Una propiedad de la recta de regresión es que siempre pasa por las coordenadas X̄Ȳ. Esto es, pasa por los valores promedios de X e Y

---
class: inverse

## Hasta ahora deberíamos saber:

1- Modelo de regresión como una **representación simplificada** de la relación compleja entre variables

2- El `$\beta$` de regresión nos dice **cuanto aumenta `$Y$` ** (variable dependiente) *en promedio* por ** cada punto que aumenta** `$X$` (variable independiente).

3- El modelo nos permite **estimar** el puntaje de `$Y$` para cada valor de `$X$`

---

# ¿Qué tan bueno es nuestro modelo?

- El cálculo del `$\beta$` busca minimizar los residuos (de ahí "mínimos cuadrados ordinarios")

- Una vez minimizados los residuos, se puede evaluar el ajuste
  - qué tan bien representa nuestro modelo la realidad
  
  - cuánto error (de predicción) estamos cometiendo con nuestro modelo

---
class: inverse, right

## Un modelo es mejor mientras **mejor refleje** lo que sucede con los datos

## En otras palabras, cuando se parece o **ajusta** mejor a los datos

## ... y en otras: cuando los **residuos** son menores

---

# Varianza explicada de Y

¿Qué parte de la varianza de ingreso (Y) se asocia a educación?

---
# Varianza explicada de Y: `$R^2$`

- ¿Cuánto de los ingresos puedo predecir con educación (regresión) y cuánto me estoy equivocando (residuos)?

- el `$R^2$`
  - es la proporción de la varianza de Y que se asocia a X
  - varía entre 0 y 1, y se puede expresar en porcentaje

- Entonces, podemos descomponer la varianza de Y en 2: aquella asociada a X (regresión) y la que no se asocia a X (residuos)

---

# Inferencia: la otra mitad de la regresión

- hasta ahora hemos interpretado solo la magnitud de los `$\beta$` de regresión. Pero,

- ¿son estos `$\beta$` **_estadísticamente_** significativos?

- es algo que podemos extrapolar de nuestra muestra a la población?

- ... o es algo que se debe simplemente al azar?

---
# Bases de inferencia:

- dispersión: varianza y desviación estandar

- curva normal

- error estándar

---
# Inferencia y significación estadística

- ¿Con qué nivel de **probabilidad** estamos dispuest_s a aceptar que las diferencias (entre promedios) son distintas de 0?

- Por convención, una probabilidad de error (o valor *p*) de menos de 0.05 (1 de 20 veces)

- Esto significa una probabilidad de acierto/nivel de confianza de 95% (2 SE)

---

---

## Volviendo a regresión

- el error estándar del promedio nos sirve como referencia cálculo de significación estadística de los coeficientes de regresión

- en regresión, las variables independientes poseen distintos niveles/valores, y queremos saber si las diferencias en Y de los valores de X son significativas = **estadísticamente distintas de 0**.

- Ej: diferencias de ingreso (Y) entre hombres y mujeres (X)

---
# Inferencia y prueba de hipótesis

- La hipótesis nula (o `$H_0$` ) se refiere a que las diferencias son = 0

- En regresión, `$H_0$` dice que nuestro beta no es distinto de cero

- Por eso, queremos rechazar `$H_0$` y para eso tenemos que establecer un nivel de probabilidad aceptable (al menos p<0.05)

---
## Prueba de hipótesis en regresión

Contrastamos la *hipótesis nula* (no hay asociación entre el predictor y la variable dependiente):

`$$H_{0}: \beta_{j} = 0$$`

En relación a la siguiente hipótesis alternativa:

`$$H_{a}: \beta_{j} \neq 0$$`

---
# Prueba T

- para **mayor precisión**, la prueba T nos permite establecer el nivel de error que estamos cometiendo al rechazar `$H_0$`

- para ello, T se ajusta por la cantidad de sujetos en la muestra (N), pero para un N>120 se aproxima a la distribución normal.

---
# Valor crítico de T

![](../../files/img/imagen4.png)

---
class: inverse

## Resumen: inferencia en regresión

- conceptos centrales: error estándar del `$\beta$` y **valor T**

- el valor T se obtiene dividiendo el beta por el error estándar

- para muestras grandes, un T > 1.96 permite rechazar `$H_0$` a un p<0.05, y T > 2.58 a un p>0.01

---
class: roja, bottom, right, slideInRight

# 4. Tabla de regresión

---
## Reporte de regresión múltiple

- en ocasiones se representa el modelo como una ecuación (opcional), y los resultados en una Tabla de Regresión

- la tabla posee ciertas características y contenidos mínimos que deben ser considerados en el reporte

- en R es posible automatizar el reporte en tablas, pero hay que agregar especificaciones para una visualización adecuada

---
.pull-left-narrow[
# Tabla de regresión

## con sjPlot
]

<table style="border-collapse:collapse; border:none;">
<caption style="font-weight: bold; text-align:left;">Modelos de regresión para puntaje en ciencia <br> (Errores estándar entre paréntesis)</caption>
<tr>
<th style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm;  text-align:left; ">&nbsp;</th>
<th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 1</th>
<th colspan="1" style="border-top: double; text-align:center; font-style:normal; font-weight:bold; padding:0.2cm; ">Modelo 2</th>
</tr>
<tr>
<td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal;  text-align:left; ">Predictores</td>
<td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal;  ">β</td>
<td style=" text-align:center; border-bottom:1px solid; font-style:italic; font-weight:normal;  ">β</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">(Intercept)</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">11.616 <sup>***</sup><br>(3.054)</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">12.325 <sup>***</sup><br>(3.194)</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">matematicas</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">0.402 <sup>***</sup><br>(0.073)</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">0.389 <sup>***</sup><br>(0.074)</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">lectura</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">0.365 <sup>***</sup><br>(0.066)</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">0.335 <sup>***</sup><br>(0.073)</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">mujer</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  "></td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">&#45;2.010 <sup></sup><br>(1.023)</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; ">status</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  "></td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:center;  ">0.050 <sup></sup><br>(0.062)</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm; border-top:1px solid;">Observations</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">200</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left; border-top:1px solid;" colspan="1">200</td>
</tr>
<tr>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; text-align:left; padding-top:0.1cm; padding-bottom:0.1cm;">R<sup>2</sup> / R<sup>2</sup> adjusted</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.478 / 0.473</td>
<td style=" padding:0.2cm; text-align:left; vertical-align:top; padding-top:0.1cm; padding-bottom:0.1cm; text-align:left;" colspan="1">0.489 / 0.479</td>
</tr>
<tr>
<td colspan="3" style="font-style:italic; border-top:double black; text-align:right;">* p&lt;0.05&nbsp;&nbsp;&nbsp;** p&lt;0.01&nbsp;&nbsp;&nbsp;*** p&lt;0.001</td>
</tr>

</table>
]]

---

![:scale 90%](../../files/img/tabreg.png)

---
## Beta estandarizado o no estandarizado

- Betas: 
  - pueden aparecer en puntaje bruto (no estandarizado) o estandarizado

- beta estandarizado: se interpreta como cuantas unidades de desviación estándar aumenta Y por cada aumento de una desviación estándar de X

- betas estandarizados permiten comparar el efecto de cada variable independiente en una misma escala (desviaciones estándar)

---
class: inverse, bottom, right

# .red[Sesión 5]
<br>

Repaso sesión anterior

---
## ¿Cuáles son los objetivos de un modelo de regresión?

* Es un modelo estadístico que se usa para:

- **Conocer**: La relación de una variable dependiente de acuerdo a una/otras independiente(s)
  - **Predecir**: Estimar el valor de una variable dependiente de acuerdo al valor de otras
  - **Inferir**: si estas relaciones son estadísticamente significativas

---

```
##   Educacion Ingreso
## 1         1     250
## 2         2     240
## 3         3     230
## 4         4     220
## 5         5     300
## 6         6     380
## 7         7     450
## 8         8     520
```

]

---
.pull-left-narrow[
### Ejemplo ]

]

---

---

### La recta de regresión

`$$\widehat{Y}=b_{0} +b_{1}X$$`

- `$\widehat{Y}$` es el valor estimado de `$Y$` (que se puede predecir)

- `$b_{0}$` es el intercepto de la recta 
  - el valor de Y cuando X es 0
  - Debido a que es una estimación, es común que sea un valor sin sentido analítico (incluso negativo)

- `$b_{1}$` es el coeficiente de regresión (pendiente de la recta), que nos dice cuánto aumenta Y por cada punto que aumenta X

]

---
### Estimación de los coeficientes de la ecuación:

`$$\bar{Y}=b_{0}+b_{1}\bar{X}$$`
Reemplazando:

`$$\bar{Y}=b_{0}+25\bar{X}$$`

Despejando el valor de `$b_{0}$`

`$$b_{0}=200-0\bar{X}$$`
---

*Por cada unidad que aumenta educación, ingreso aumenta en 25 unidades*
]

---

¿y la interpretación para variables categóricas?

.pull-left[
.small[
<table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;">
<thead>
<tr>
<th style="padding-left: 5px;padding-right: 5px;">&nbsp;</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 1</th>
</tr>
</thead>
<tbody>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Intercepto</td>
<td style="padding-left: 5px;padding-right: 5px;">245.00<sup>&#42;&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(51.74)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Educación media</td>
<td style="padding-left: 5px;padding-right: 5px;">-20.00</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(73.18)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Educación superior</td>
<td style="padding-left: 5px;padding-right: 5px;">167.50<sup>&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(63.37)</td>
</tr>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.70</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.58</td>
</tr>
<tr style="border-bottom: 2px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td>
<td style="padding-left: 5px;padding-right: 5px;">8</td>
</tr>
</tbody>
<tfoot>
<tr>
<td style="font-size: 0.8em;" colspan="2"><sup>&#42;&#42;&#42;</sup>p &lt; 0.001; <sup>&#42;&#42;</sup>p &lt; 0.01; <sup>&#42;</sup>p &lt; 0.05</td>
</tr>
</tfoot>
</table>
]
]
--
.pull-right[
*Las personas que tienen educación superior ganan $167.5mil más en comparación con quienes tienen educación básica, efecto que es estadísticamente significativo (p<0.05)*

]

---
¿Cómo podemos predecir el valor esperado de una variable para una persona en particular?

.pull-left-narrow[
.small[
<table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;">
<thead>
<tr>
<th style="padding-left: 5px;padding-right: 5px;">&nbsp;</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 1</th>
</tr>
</thead>
<tbody>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Intercepto</td>
<td style="padding-left: 5px;padding-right: 5px;">245.00<sup>&#42;&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(51.74)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Educación media</td>
<td style="padding-left: 5px;padding-right: 5px;">-20.00</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(73.18)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Educación superior</td>
<td style="padding-left: 5px;padding-right: 5px;">167.50<sup>&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(63.37)</td>
</tr>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.70</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.58</td>
</tr>
<tr style="border-bottom: 2px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td>
<td style="padding-left: 5px;padding-right: 5px;">8</td>
</tr>
</tbody>
<tfoot>
<tr>
<td style="font-size: 0.8em;" colspan="2"><sup>&#42;&#42;&#42;</sup>p &lt; 0.001; <sup>&#42;&#42;</sup>p &lt; 0.01; <sup>&#42;</sup>p &lt; 0.05</td>
</tr>
</tfoot>
</table>
]
]

Reemplazando:

`$$\bar{Y}=245+b_{1}\bar{X}$$`

¿Si una persona tuviera un nivel de educación superior?

`$$\bar{Y}=245+167.5$$`
`$$\bar{Y}=412.5$$`
]

---
.pull-left-narrow[
## Graficando
]

![:scale 85%](../../files/img/plot3.png)
]

---
## Variables numéricas

<table class="texreg" style="margin: 10px auto;border-collapse: collapse;border-spacing: 0px;caption-side: bottom;color: #000000;border-top: 2px solid #000000;">
<thead>
<tr>
<th style="padding-left: 5px;padding-right: 5px;">&nbsp;</th>
<th style="padding-left: 5px;padding-right: 5px;">Model 1</th>
</tr>
</thead>
<tbody>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">(Intercept)</td>
<td style="padding-left: 5px;padding-right: 5px;">52.51</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(81.44)</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">edad</td>
<td style="padding-left: 5px;padding-right: 5px;">7.89<sup>&#42;</sup></td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">&nbsp;</td>
<td style="padding-left: 5px;padding-right: 5px;">(2.26)</td>
</tr>
<tr style="border-top: 1px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.67</td>
</tr>
<tr>
<td style="padding-left: 5px;padding-right: 5px;">Adj. R<sup>2</sup></td>
<td style="padding-left: 5px;padding-right: 5px;">0.62</td>
</tr>
<tr style="border-bottom: 2px solid #000000;">
<td style="padding-left: 5px;padding-right: 5px;">Num. obs.</td>
<td style="padding-left: 5px;padding-right: 5px;">8</td>
</tr>
</tbody>
<tfoot>
<tr>
<td style="font-size: 0.8em;" colspan="2"><sup>&#42;&#42;&#42;</sup>p &lt; 0.001; <sup>&#42;&#42;</sup>p &lt; 0.01; <sup>&#42;</sup>p &lt; 0.05</td>
</tr>
</tfoot>
</table>

---
.pull-left[

![:scale 100%](../../files/img/plot4.png)
]

Reemplazando:

`$$\bar{Y}=52.51+b_{1}*7.89$$`

¿Una persona de edad 40?

`$$\bar{Y}=52.51+40*7.89$$`
`$$\bar{Y}=368.11$$`
]
---
## Tips para la prueba

- Definiciones de conceptos clave: ¿Qué es el coeficiente de regresión? ¿Qué es parcialización? ¿Qué es el intercepto?

- Estimación (cálculo) del coeficiente de regresión

- Interpretación de tabla de regresión (intercepto, coeficientes de regresión, inferencia, control estadístico, R2)

---

### Ejemplos para estimar el coeficiente de regresión

| Caso                  | X          | Y         | X - X̄ | Y - Ȳ | (X - X̄) * (Y - Ȳ) | (X - X̄)²  |
| --------------------- | ---------- | --------- | ------ | ----- | ------------------- | ---------- |
| Caso 1                | 1          | 2         | -2     | -4    | 8                   | 4          |
| Caso 2                | 2          | 4         | -1     | -2    | 2                   | 1          |
| Caso 3                | 3          | 6         | 0      | 0     | 0                   | 0          |
| Caso 4                | 4          | 8         | 1      | 2     | 2                   | 1          |
| Caso 5                | 5          | 10        | 2      | 4     | 8                   | 4          |
| **Promedios / Sumas** | **X̄ = 3** | **Ȳ = 6** |        |       | **Σ = 20**          | **Σ = 10** |

]

Y = 0 + 2X
---

### Ejemplos para estimar el coeficiente de regresión

| Caso                  | X          | Y         | X - X̄ | Y - Ȳ | (X - X̄) \* (Y - Ȳ) | (X - X̄)²  |
| --------------------- | ---------- | --------- | ------ | ----- | ------------------- | ---------- |
| Caso 1                | 1          | 3         | -2     | -6    | 12                  | 4          |
| Caso 2                | 2          | 6         | -1     | -3    | 3                   | 1          |
| Caso 3                | 3          | 9         | 0      | 0     | 0                   | 0          |
| Caso 4                | 4          | 12        | 1      | 3     | 3                   | 1          |
| Caso 5                | 5          | 15        | 2      | 6     | 12                  | 4          |
| **Promedios / Sumas** | **X̄ = 3** | **Ȳ = 9** |        |       | **Σ = 30**          | **Σ = 10** |

Y = 0 + 3X

]

---

### Ejemplos para estimar el coeficiente de regresión

| Caso                  | X          | Y          | X - X̄ | Y - Ȳ | (X - X̄)(Y - Ȳ) | (X - X̄)²  |
| --------------------- | ---------- | ---------- | ------ | ----- | --------------- | ---------- |
| Caso 1                | 0          | 5          | -2     | -6    | 12              | 4          |
| Caso 2                | 1          | 8          | -1     | -3    | 3               | 1          |
| Caso 3                | 2          | 11         | 0      | 0     | 0               | 0          |
| Caso 4                | 3          | 14         | 1      | 3     | 3               | 1          |
| Caso 5                | 4          | 17         | 2      | 6     | 12              | 4          |
| **Promedios / Sumas** | **X̄ = 2** | **Ȳ = 11** |        |       | **Σ = 30**      | **Σ = 10** |

Y = 5 + 3X

]

---

### Regresión lineal con variable dependiente participación en protestas

| Variable                                                                 | Std(B)  | IC. 95%          |
|--------------------------------------------------------------------------|---------|------------------|
| Ingreso mensual del hogar                          | .175*** | [.117, .232]     |
| Satisfacción con situación económica del país                            | -.131** | [-.191, -.071]   |
| Identificación política de izquierda (ref. Distinto de izquierda)                     | .150*** | [.091, .209]     |
| Identificación con causas sociales                                       | .233*** | [.172, .294]     |
| Participación en organizaciones                                          | .270*** | [.214, .326]     |
| Edad                                                | .076*   | [.017, .135]     |
| Nivel educacional                                                        | .073*   | [.008, .138]     |
|                                                                          |         |                  |
| R²                                                                       | .269    |                  |
| n                                                                        | 930     |                  |
| | |*p < .05, **p < .01, ***p < .001*|

]

---

### Regresión lineal con variable dependiente Satisfacción con la democracia

[https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543](https://revistadesociologia.uchile.cl/index.php/RDS/article/view/47884/50543)

- Revisar sección resultados (página 43 en adelante)

---

.pull-left[
# Métodos estadísticos para ciencias sociales III
## **Kevin Carrasco**
## Sociología - UNAB
## 2do Semestre 2025
## .green[[metod3-unab.netlify.com](metod3-unab.netlify.com)]
]

.pull-right[
.right[
<br>
## .yellow[Sesión 6: Regresión múltiple y estimación de valores predichos]
![:scale 70%](../../files/img/eval-hires.png)

]