Resumo A relevância de um Censo Demográfico para o sistema de estatísticas públicas de uma nação é indiscutível do ponto de vista de sua abrangência temática e territorial. Em contrapartida, sua complexidade e dimensão levam a desafios na garantia da qualidade de seus resultados. O presente artigo tem por objetivo apresentar os possíveis fatores associados a erros não amostrais detectados na coleta das informações, mediante a análise de paradados e dos microdados do Censo Demográfico brasileiro de 2010. Os dados utilizados provêm das informações sobre a operação de coleta e administração da pesquisa oriundas, respectivamente, do sistema de gerenciamento de recursos humanos do pessoal de coleta e do sistema de supervisão da operação de coleta, ou seja, os paradados. Também se utilizam os microdados do universo do Censo Demográfico. Neste estudo foram analisadas as divergências observadas entre as informações coletadas pelos recenseadores e aquelas obtidas por supervisores nas reentrevistas realizadas em procedimentos de supervisão do trabalho de campo. Para análise de divergências detectadas entre os dados coletados por recenseadores e supervisores, foram empregados modelos hierárquicos generalizados. Os resultados mostram que existem diferenciais nas divergências associados à estrutura de coleta dos dados e às características dos recenseadores, supervisores e informantes, além de revelarem diferenças regionais. Fica evidente, sobretudo, uma forte influência das características do informante nas chances de ocorrência das divergências, em detrimento das características dos supervisores e recenseadores. Os resultados da modelagem estatística sugerem que as entrevistas realizadas com informantes do sexo masculino, analfabetos ou com baixa escolaridade, mais velhos e que vivem em domicílios com indicadores que refletem condições de vida menos satisfatórias apresentam aumento nas chances em favor da ocorrência de divergências entre respostas coletadas por recenseador e supervisor.
Abstract The relevance of a population census for a national statistical system is undeniable for its thematic and territorial coverage. Nonetheless, the complexity and size of a census operation lead to challenges for ensuring timeliness and quality of the results. This paper presents potential factors associated with non sampling errors detected in the data collection stage based on the analysis of Brazilian 2010 Population Census microdata and paradata. Data obtained from the field work monitoring system, called paradata, is used to provide information about divergences observed between data collected by enumerators and supervisors, also it is used the census microdata. The latter carried out follow-up interviews in households selected by the supervision/monitoring plan. Human resources databases containing socio-demographic information of enumerators and supervisors is also brought to enhance the analysis. The statistical modeling utilized is generalized hierarchical models, in which the response variable is defined as the occurrence of a discrepancy (or divergence) between the information collected by enumerators and their supervisors. The results indicate that the different hierarchical levels investigated are relevant to decompose data variability and hence have to be considered in the analysis. However, respondents’ characteristics have markedly more influence on the chances of a divergence than those of enumerators’ and supervisors’. In addition, there is evidence that respondents who are male, illiterate (or with low educational level), older and living in households with indicators reflecting poor life conditions present higher odds in favor of the occurrence of divergences on data collected by enumerator and supervisor.
Resumen La relevancia de un censo para el sistema de estadísticas públicas de una nación es indiscutible desde el punto de vista de su cobertura temática y territorial. Por otra parte, su complejidad y dimensión conducen a desafíos para garantizar la calidad de sus resultados. Este artículo tiene como objetivo presentar los posibles factores asociados a errores no muestrales detectados durante el relevamiento de los datos, mediante el análisis de los paradatos y microdatos del Censo Demográfico brasileño de 2010. Los paradatos se refieren a informaciones sobre la operación de relevamiento y la administración de la investigación originarias, respectivamente, del sistema de gestión de recursos humanos del personal dedicado a la recogida y del sistema de supervisión de la operación de recolección. Este estudio analizó las divergencias observadas entre las informaciones recogidas por los encuestadores y las informaciones obtenidas por los supervisores en las reentrevistas de los procedimientos de supervisión del trabajo de campo. Para el análisis de las divergencias entre informaciones recogidas por los encuestadores y supervisores se utilizaron modelos jerárquicos generalizados. El estudio muestra que hay diferencias en las discordancias asociadas con la estructura de relevamiento de los datos, con las características de los encuestadores, supervisores e informantes, y revelan diferencias regionales. Queda evidente, sobretodo, una fuerte influencia de las características del informante en las posibilidades de ocurrencia de divergencias, en detrimento a las características de los supervisores y encuestadores. Los resultados del modelo estadístico sugieren que las entrevistas realizadas con informantes del sexo masculino, analfabetos o con bajo nivel educativo, mayores y que viven en hogares con indicadores que reflejan condiciones de vida menos satisfactorias, presentan chances adicionales en favor de la ocurrencia de divergencia entre las respuestas recogidas por el encuestador y el supervisor.