OBJETIVO: Avaliar a viabilidade de estratégia de relacionamento probabilístico de bases de dados na identificação de óbitos de pacientes submetidos a procedimentos de alta complexidade em cardiologia. MÉTODOS: O custo de processamento foi estimado com base em 1.672 registros de pacientes submetidos à cirurgia de revascularização do miocárdio, relacionados com todos os registros de óbito no Brasil em 2005. A acurácia do relacionamento baseou-se em linkage probabilístico entre 99 registros de autorização de internação hospitalar de pacientes submetidos a cirurgias cardíacas em instituto de referência em cardiologia, com status vital conhecido, e todos os registros de óbito do estado do Rio de Janeiro em 2005. O linkage foi realizado em quatro etapas: padronização das bases, blocagem, pareamento e classificação dos pares. Utilizou-se a blocagem em cinco passos, com chaves de blocagem com combinação de variáveis como soundex do primeiro e último nome, sexo e ano de nascimento. As variáveis utilizadas no pareamento foram "nome completo", com a utilização da distância de Levenshtein, e "data de nascimento". RESULTADOS: O segundo e o quinto passos de blocagem tiveram os maiores números de pares formados e os maiores tempos de processamento para o pareamento. O quarto passo demandou menor custo de processamento. No estudo de acurácia, após os cinco passos de blocagem, a sensibilidade do linkage foi de 90,6% e a especificidade foi de 100%. CONCLUSÕES: A estratégia de relacionamento probabilístico utilizada apresenta boa acurácia e poderá ser utilizada em estudos sobre a efetividade dos procedimentos de alta complexidade e alto custo em cardiologia.
OBJECTIVE: To evaluate the viability of a probabilistic record linkage strategy to identify patients who underwent complex cardiology procedures among the total deceased population. METHODS: The processing cost was estimated based on 1,672 records of patients undergoing coronary artery bypass grafting that were compared with all death records in Brazil in 2005. The accuracy of the linkage strategy was based on the probabilistic linkage of 99 hospital admissions records of patients, with known vital status, who underwent cardiac surgery at a single cardiology institute, with the death records of the state of Rio de Janeiro, Southeastern Brazil, in 2005. Linkage was conducted in four stages: standardizing the databases, blocking, matching, and rating peers. Blocking in five steps was used, with blocking keys formed by a combination of variables such as soundex codes for the first and last names, sex, and year of birth. The variables used for matching were "full name" with the use of Levenshtein distance and "birth date". RESULTS: The second and fifth blocking steps resulted in the largest number of formed pairs and the largest processing times for the matching. The fourth step required a lower processing cost. In the accuracy study, after five blocking steps, the sensitivity of the linkage was 90.6%, and the specificity was 100%. CONCLUSIONS: The probabilistic strategy used has high accuracy and can be used in studies of the effectiveness of high-complexity, high-cost cardiology procedures.
OBJETIVO: Evaluar la viabilidad de estrategia de relación probabilística en la identificación de pacientes sometidos a procedimientos de alta complejidad en cardiología. MÉTODOS: El costo de procesamiento fue calculado con base en 1.672 registros de pacientes sometidos a cirugía de revascularización del miocardio, relacionados con todos los registros de óbito en Brasil en 2005. La precisión de la relación se basó en linkage probabilística de 99 registros de autorización de internación hospitalaria de pacientes sometidos a cirugías cardíacas en instituto de referencia en cardiología, con status vital conocido, con todos los registros de óbito del estado de Rio de Janeiro en 2005. El linkage fue realizado en cuatro etapas: estandarización de las bases, blocaje, pareamiento y clasificación de los pares. Se utilizó blocaje en cinco pasos, con claves de blocaje con combinación de variables como soundex del primero y último nombre, sexo y año de nacimiento. Las variables utilizadas en el pareamiento fueron "nombre completo", con la utilización de la distancia de Levenshtein y "fecha de nacimiento". RESULTADOS: El segundo y el quinto pasos de blocaje tuvieron los mayores números de pares formados y los mayores tiempos de procesamiento para el pareamiento. El cuarto paso demandó menor costo de procesamiento. En el estudio de precisión, posterior a cinco pasos de blocaje, la sensibilidad del linkage fue de 90,6% y la especificidad fue de 100%. CONCLUSIONES: La estrategia de relación probabilística utilizada presenta buena precisión y podrá ser utilizada en estudios sobre la efectividad de los procedimientos de alta complejidad y alto costo en cardiología.