Tradicionalmente, los datos básicos de Estados Unidos sobre temas como empleo/desempleo e ingresos familiares se derivan de encuestas gubernamentales: es decir, a las personas se les llama por teléfono o se les envían formularios, o ambas cosas, y se contabilizan sus respuestas. Obviamente hay problemas con este enfoque: por ejemplo, si usted recibe beneficios del gobierno, pero también tiene un trabajo adicional para ganar algo de dinero extra, ¿es probable que sea honesto cuando alguien del gobierno le pregunte si está empleado? Sin embargo, al menos se podría argumentar que si las encuestas se realizan (aproximadamente) de la misma manera a lo largo del tiempo, entonces este tipo de sesgos serían (aproximadamente) los mismos a lo largo del tiempo.
Pero el ritmo al que la gente está dispuesta a responder encuestas ha disminuido sustancialmente en los últimos años. La Academia Nacional de Ciencias ha publicado un par de informes recientes sobre lo que se podría hacer: Hacia una infraestructura de datos nacional del siglo XXI: movilización de información para el bien común (2023) describe la importancia de datos gubernamentales públicos y confiables para el funcionamiento de la economía. , la disminución de las tasas de respuesta a las encuestas, cómo determinadas series de datos se están interrumpiendo gradualmente como resultado de ello; en un informe complementario, Hacia una infraestructura nacional de datos del siglo XXI: mejorar los programas de encuestas mediante el uso de múltiples fuentes de datos (2023) inicia una discusión sobre qué fuentes alternativas de datos públicos podrían ser plausibles.
A continuación se muestra una tabla que muestra el problema de la disminución de las tasas de respuesta de los hogares en la última década, especialmente desde que se produjo la pandemia en 2020. La Encuesta de Población Actual (CPS) proporciona los datos básicos sobre el empleo, los ingresos y la fuerza laboral. Hace una década tenía una tasa de respuesta del 90%, ahora baja al 73%. La encuesta sobre el Índice de Precios al Consumidor (IPC) de Vivienda recopila datos sobre los precios de las viviendas de alquiler y también estima el “equivalente del alquiler por parte del propietario”. Estas cifras se incorporan a las estimaciones de la inflación general. Esta encuesta tuvo una tasa de respuesta del 70% en 2014, pero se redujo al 52% en 2022. La Encuesta de Gasto Actual (CE) recopila datos sobre cómo los hogares gastan su dinero y, entre otros propósitos, se utiliza para ponderar los cambios de precios observados. y desarrollar la tasa de inflación. Se ha reducido a una tasa de respuesta del 43%. La Encuesta del Panel de Gastos Médicos recopila datos de hogares y proveedores de atención médica. familias e individuos, sus proveedores médicos. Antes de la pandemia, la tasa de respuesta se había reducido al 46%. La Encuesta sobre la Comunidad Estadounidense (ACS) recopila datos anuales sobre una amplia gama de factores sociales, económicos, de vivienda y demográficos hasta el nivel comunitario. Su tasa de respuesta era del 97% hace una década y se había reducido al 71% antes de que llegara la pandemia.
Cuando las tasas de respuesta a la encuesta caen tan dramáticamente, la confiabilidad de la información también disminuye. Los problemas de respuesta a las encuestas son tan graves que varias encuestas especializadas han sido canceladas o, en algunos casos, suspendidas por un tiempo. El informe de la NAS señala (citas omitidas):
Los crecientes costos de obtener participación y los presupuestos fijos o en disminución han llevado a la eliminación, o amenaza de eliminación, de múltiples programas y encuestas importantes. … Por ejemplo, en 1996, el Sistema Nacional de Estadísticas Vitales, parte del Centro Nacional de Estadísticas de Salud, suspendió la recopilación de datos detallados basados en registros nacionales sobre matrimonios y divorcios. En 2008, después de publicar estimaciones del cuarto trimestre de 2007, la Oficina del Censo de EE. UU. puso fin a su encuesta trimestral que medía modificaciones, mejoras y reparaciones residenciales. A falta de estadísticas oficiales, las estimaciones del sector privado sobre el tamaño del mercado de mejoras para el hogar varían ampliamente. Para 2020, las estimaciones del sector privado oscilaron entre 150.000 millones de dólares (Statista, 2022) y 325.000-333.000 millones de dólares. La eliminación del programa de Estadísticas de Despidos Masivos de la Oficina de Estadísticas Laborales de EE. UU. (BLS), un programa cooperativo entre la BLS y los estados, resultó en la pérdida de un enfoque estandarizado en todos los estados para identificar, describir y rastrear los efectos de las pérdidas importantes de empleos. Con la pérdida de la Encuesta sobre Tecnologías de la Información y las Comunicaciones, ya no hay estimaciones anuales oficiales de compras de software o equipos de información, comunicaciones y tecnología, un mercado enorme y en crecimiento. Según un informe encargado por Census Project, un grupo de defensa no partidista, el futuro de la ACS está amenazado. Los expertos argumentaron que la ACS, una encuesta fundamental para la infraestructura de datos del país, necesita una
Entre 100 y 300 millones de dólares adicionales en financiación para abordar las limitaciones actuales y
introducir mejoras muy necesarias.
¿Quiere entonces conocer la estimación del gasto en TI y software en la economía estadounidense? ¡Podría ser importante! Pero la encuesta terminó. ¿Quiere estudiar cómo la gente gasta dinero en arreglar sus casas, quizás en lugar de mudarse, en esta era de trabajo desde casa y tasas de interés más altas? Podría ser importante. Pero la encuesta terminó. ¿Quiere estudiar los patrones de matrimonio y divorcio, tanto los efectos en los involucrados como en el cuidado de niños y padres ancianos? Podría ser importante. Pero el gobierno federal no recopila los datos.
Parte del problema aquí es simplemente que el gobierno necesita gastar más en recopilar estadísticas. Como he señalado en el pasado, el gasto federal total en recopilación de estadísticas es del 0,18% del presupuesto federal; eso no es el 18%, sino menos de una quinta parte del 1%. Sería una inversión social sensata gastar más aquí: digamos, un 0,1% adicional del gasto federal. Pero a medida que los métodos tradicionales de recolección de datos basados en encuestas se vuelven cada vez menos confiables, la base estadística también necesita cambiar a fuentes alternativas de datos.
Este cambio ya está ocurriendo. Los investigadores están haciendo un uso mucho más amplio de los datos “administrativos” que se recopilan para otros fines: por ejemplo, poder consultar los datos de las declaraciones de impuestos para medir los ingresos, o los datos de la Seguridad Social para medir los salarios, puede ser más preciso que basarse en encuestas de hogares. . Las preguntas obvias aquí son cómo limitar el uso de datos administrativos para que muestren patrones generales pero no invadan la privacidad de los individuos. Además, como los datos administrativos no fueron diseñados para usarse con fines de investigación, es necesario manejarlos con cuidado. Pero estos obstáculos son superables.
El segundo volumen de la NAS inicia un debate sobre la ampliación de otras formas de las fuentes de datos gubernamentales disponibles públicamente. En algunos casos, esto puede significar estar abiertos a encontrar formas de vincular los datos existentes. Por ejemplo, el informe de la NAS pone el ejemplo de que había datos del Departamento de Vivienda y Desarrollo Urbano de EE.UU. sobre qué viviendas tenían mayores o menores riesgos de exposición al plomo para los niños. Había datos de la Encuesta Nacional de Examen de Salud y Nutrición (NHANES) sobre los niveles de plomo en la sangre de los niños. Pero no hubo ningún vínculo entre los dos: es decir, no fue posible determinar cómo vivir en un lugar con menos exposición al plomo afectaba el nivel de plomo en el torrente sanguíneo de los niños. Sin embargo, fue posible vincular registros de hogares reales, tanto dónde vivían como los niveles de plomo en la sangre de los niños, y hacerlo con un sistema de numeración anónimo para que la información de ningún hogar específico no estuviera disponible para los investigadores.
Pero el informe también considera una amplia gama de otros datos. Además de preguntar a los hogares qué compran, por ejemplo, tal vez los registros de ventas reales de las tiendas de comestibles o puntos de venta minoristas podrían ayudar. Al aprender, por ejemplo, sobre seguros médicos, de automóvil o de hogar, tal vez los datos reales de las compañías de seguros podrían ayudar. Para cuestiones como la medición ambiental y la agricultura, las imágenes satelitales pueden ayudar. Los datos de ubicación de los teléfonos móviles y los datos de salud de los rastreadores de actividad física pueden resultar útiles. Los datos pueden extraerse de la web, de las redes sociales o de fuentes colectivas.
Es fácil pensar en formas en las que estas fuentes alternativas de datos podrían extraviarse, ya sea en cuanto a precisión o al revelar información personal. Además, los datos gubernamentales deben estar disponibles a intervalos regulares, ser ampliamente representativos y comparables a lo largo del tiempo, no simplemente un volcado de datos único. Pero también es obvio que la información disponible públicamente es muy útil y que los métodos actuales de recopilación de datos públicos están en proceso de desviarse.