d'Economía.net

ECONOMÍA

Cómo enseñar ciertas cosas complicadas como la diferencia entre desviación estándar y error estándar


Los estudiantes de mi clase sobre regresión aplicada e inferencia causal deben contribuir a un documento compartido en línea. Antes de cada clase, cada estudiante debe ingresar algo en el documento, ya sea una pregunta sobre la lectura/tarea o una respuesta a la pregunta de algún otro estudiante. Luego en clase comentamos algunas de las preguntas que surgieron.

¡Esto puede funcionar muy bien! Por ejemplo, de la clase de hoy:

Estudiante #1: Estoy un poco confundido con la fórmula de la figura 6.4. La ecuación inicial es y = 30 + 0,54x, pero estoy un poco confundido sobre cómo derivamos a la ecuación equivalente y = 63,9 + 0,54(x − 62,5)

Estudiante #2: Si lo multiplicas: y = 63,9 + 0,54(x − 62,5) = 63,9 + 0,54x − 33,75 ≈ 30 + 0,54x. Entonces tienes la misma ecuación al final. Pero se transforma porque una intercepción donde x = 0 no tiene mucho sentido práctico en algunos casos (como la altura, donde nadie puede medir 0 pulgadas). Así que escribimos esa ecuación, centrándola alrededor de la media, para darle más significado a la intersección.

A veces, muchos estudiantes hacen preguntas iguales o similares y definitivamente queremos discutirlas en vivo. Por ejemplo:

Estudiante #3: ¿Cómo se calcula exactamente la desviación estándar residual y qué significa conceptualmente? ¿Cómo podemos entenderlo en comparación con el error estándar y la desviación estándar?

Estudiante #4: También tenía una pregunta sobre esto. Considero que los términos “error estándar”, “desviación estándar”, “desviación estándar del residual” y “error estándar de los valores verdaderos de los parámetros” a veces se usan indistintamente, lo que puede resultar muy confuso. Por ejemplo, cuando leí las instrucciones para el problema 1a, supuse que nos pedían tomar el error estándar, es decir, la desviación estándar dividida por el cuadrado de n. Sin embargo, en el libro se deja claro que debemos utilizar la puntuación sigma producida por el modelo stan_glm. ¿Hay alguna manera de recordar qué concepto se está invocando y cuándo avanzar, o es algo que simplemente tenemos que discernir a través del contexto y nuestra intuición?

Estudiante #5: Sí, tengo las mismas preguntas aquí. Parece que la desviación estándar residual describe la desviación estándar de los términos de error en la función.

Estudiante #6: También tengo esta pregunta: ¿la incertidumbre y el error estándar son lo mismo? ¿Y es MD_SD igual al error estándar que es sd/cuadrado(n)? Y usando lm, ¿la incertidumbre impresa es la desviación estándar o el error?

Entonces hablé sobre la desviación estándar y el error estándar en clase. No salió bien. Dije que el error estándar es la desviación estándar estimada de la estimación de un parámetro, escribí algunas anotaciones en la pizarra y le di algunas explicaciones. Nada de lo que dije estuvo mal, pero no creo que haya ayudado.

¡Y no es broma, no ayudó! Por supuesto mi explicación no ayudó. Este era un tema sobre el que los estudiantes ya estaban confundidos. Más charlatanería de mi parte no solucionarán ese problema.

Esto es lo que creo que debería haber hecho. En lugar de dar esta definición y explicación, debería haber dicho simplemente que la definición y la explicación están en el libro y debería haber usado el tiempo de clase para repasar un ejemplo. Por ejemplo, apenas unos minutos antes habíamos discutido en clase este modelo ajustado que predice el porcentaje de votos bipartidistas del candidato actual a la presidencia dado el crecimiento porcentual del ingreso per cápita en el año anterior a las elecciones, utilizando todas las elecciones posteriores a la Segunda Guerra Mundial. :

1948-2020:

            Median MAD_SD
(Intercept) 46.7    1.4
growth       2.8    0.6
Auxiliary parameter(s):
      Median MAD_SD
sigma 3.7 0.7

Así que podría haber revisado cada uno de los SD en la pantalla, junto con sigma, y ​​pedir a los estudiantes en parejas que se explicaran entre sí el significado de cada uno de ellos. Entonces lo siguiente sería preguntarse qué pasaría con estos números si N se multiplicara por 2, o por 4.

En este punto, si los estudiantes quisieran hacer sus preguntas sobre la desviación estándar y el error estándar, podríamos hacerlo en el contexto de este ejemplo del que acaban de hablar. También podríamos regresar a su tarea.

Mi error fue “explicar” en lugar de demostrar. La explicación es un callejón sin salida. La demostración mira hacia el futuro y permite que los estudiantes participen, lo cual es absolutamente necesario si desea que aprendan algo.

Y si queremos hacer un seguimiento, podemos revisar los otros modelos ajustados que analizamos, dividiendo los datos en dos partes:

1948-1988:

            Median MAD_SD
(Intercept) 44.8    2.7
growth       3.5    1.0
Auxiliary parameter(s):
      Median MAD_SD
sigma 4.5 1.2
1992-2020:

            Median MAD_SD
(Intercept) 48.4    1.5
growth       1.6    1.1
Auxiliary parameter(s):
      Median MAD_SD
sigma 2.8 0.8

Creo que esta forma alternativa de enseñar, utilizando ejemplos en lugar de explicaciones, habría funcionado mejor por tres razones:

1. La explicación todavía está en el libro para que los estudiantes la lean cuando estén listos.

2. Debería ser más fácil seguir la idea en el contexto de un ejemplo familiar que en un marco abstracto en términos de estimaciones y distribuciones muestrales.

3. Incluso si todavía no comprenden completamente el concepto, mientras tanto es posible que hayan aprendido una habilidad relacionada útil que los hará avanzar.



Statistical Modeling, Causal Inference, and Social Science

RELACIONADOS