Resumo Objetivo: Apresentar metodologia padronizada para vinculação de diferentes bancos de dados em saúde pública. Métodos: Artigo de revisão metodológica, com descrição específica de processos de tratamento de dados para vinculação (linkage) determinística entre bancos de dados estruturados. Instruiu-se como tratar os dados, selecionar chaves de vinculação e vincular os bancos, utilizando-se dois bancos de dados simulados no software R. Resultados: Foram apresentados os comandos utilizados para a vinculação determinística, do tipo inner_join. O processo de vinculação resultou em um banco de dados com 40.108 pares ao se utilizar apenas a chave “Nome”. Com a adição da segunda chave, “Nome da mãe”, o resultado caiu para 112 pares. Ao adicionar a terceira chave, “Data de nascimento”, apenas dois pares foram identificados. Conclusão: A vinculação de bancos de dados e suas análises são ferramentas válidas e úteis para os serviços de saúde, no apoio a ações de vigilância em saúde.
Abstract Objective: To present a standardized methodology for linking different public health databases. Methods: This was a methodological review article specifically describing data processing procedures for deterministic linkage between structured databases. It instructs on how to: treat data, select linkage keys, and link databases using two databases simulated in R software. Results: The commands used for the deterministic linkage of the inner_join type were presented. The linkage process resulted in a database with 40,108 pairs using only the “Name” key. Adding the second key, “Name of mother”, the resulted dropped to 112 pairs. By adding the third key, “Date of birth”, only two pairs were identified. Conclusion: Database linkage and its analysis are valid and valuable tools for health services in supporting health surveillance actions.
Resumen Objetivo: Presentar metodología estandarizada para vincular diferentes bases de datos de salud pública. Métodos: Artículo de revisión metodológica y descripción de los procesos de tratamiento de datos para la vinculación determinista entre bases de datos. Se dieron instrucciones sobre como manejar los datos, seleccionar claves de vinculación y vincular las bases de datos empleando dos bases de datos simuladas en el software R. Resultados: Se presentaron los comandos utilizados para la vinculación determinista, del tipo inner-join. El proceso resultó en una base de datos con 40.108 pares utilizando únicamente la clave “Nombre”. Con la adición de la segunda clave, “Nombre de la madre”, el resultado se redujo a 112 pares. Al agregar la tercera clave, “Fecha de nacimiento”, solo se identificaron dos pares. Conclusión: La vinculación de bases de datos y sus análisis son herramientas válidas y útiles para que los servicios de salud las utilicen para apoyar las acciones de vigilancia en la salud.