Background In Argentina, several models of risk adjustment (scores) in cardiac surgery have been proposed, which generally have not been validated in populations other than those originally described. Additionally, different surgeons utilize different scores to compare and present their results. Objectives This study was performed with the goal of assessing the performance of seven scores of mortality risk in cardiac surgery, which are commonly used in our country. Material and Methods A group of 502 patients who underwent surgery between 2004 and 2005 were analyzed prospectively. Preoperative variables were identified for the calculation of seven mortality risk scores: four international scores: Parsonnet, Ontario, EuroSCORE and Cleveland, and three local scores: CONAREC, Español and Favaloro. To assess the discrimination, accuracy and calibration of each score, the following were calculated: expected average risk of each score, Hosmer and Lemeshow goodness of fit, coefficient Q, ROC areas, Shannon index and three graphic methods. Results A comparison of the ROC areas for all types of cardiac surgery showed that the EuroSCORE had the best area (78.7%), together with the Español score (78.6%). Although these models had the higher predictive value, no statistical differences were found when they were compared to the other models. For coronary surgery, the EuroSCORE again was the most predictive (76.3%), followed by the Cleveland (76%), although here too, there were no statistical difference with the other scores. For all types of surgery, the Ontario score had the best global Shannon index (0.913), but had the worst index of deaths (0.074), which shows that it assigned lower expected risks to survivors, but it also assigned low risks to those who died. The EuroSCORE ranked second for the global index (0.905) and for deaths (0.106). For coronary surgery, the Español score had the higher global index (0.945), but also the lowest index of deaths (0.050), which indicates good accuracy in the first case and poor accuracy only when the deceased are taken into account. The EuroSCORE is positioned slightly better by the Shannon indices of 0.926 and 0.073, when assessing both types of values. Conclusions The comparison of seven scores to stratify mortality risk in cardiac surgery showed that the EuroSCORE had the best performance, for valvular as well as for coronary procedures. As to the Español score, it had a similar performance when all types of surgery were considered, whereas the Cleveland score was better to stratify risk in coronary disease. According to Shannon's index, the accuracy to predict mortality in the individual patient was poor with all the models assessed.
Introducción En la Argentina se elaboraron varios modelos de ajuste por riesgo (scores) de mortalidad en cirugía cardíaca que en general no fueron validados en poblaciones diferentes de las que les dieron origen. Asimismo, distintos cirujanos utilizan diferentes scores para comparar y presentar sus resultados. Objetivos El presente trabajo se llevó a cabo con el propósito de evaluar el desempeño de siete scores de riesgo de mortalidad en cirugía cardíaca de uso corriente en nuestro medio. Material y métodos Se analizaron prospectivamente 502 pacientes sometidos a cirugía cardíaca entre 2004 y 2005. Se identificaron las variables preoperatorias para el cálculo de siete scores de riesgo de mortalidad, cuatro internacionales, Parsonnet, Ontario, EuroSCORE y Cleveland, y tres locales, CONAREC, Español y Favaloro. Para determinar la discriminación, la precisión y la calibración de cada score, se calculó el riesgo esperado promedio de cada uno, la bondad de ajuste de Hosmer y Lemeshow, el coeficiente Q, las áreas ROC, el índice de Shannon y tres métodos gráficos. Resultados La comparación de las áreas ROC para todo tipo de cirugía cardíaca mostró que el EuroSCORE tuvo la mejor área (78,7%), junto con el score del Español (78,6%). Aunque estos modelos tuvieron el valor predictivo más alto, no se encontraron diferencias estadísticas al compararlos con el resto de los modelos. Para la cirugía coronaria, el EuroSCORE nuevamente mostró la mejor predicción (76,3%), y luego el de Cleveland (76,0%), a pesar de que tampoco se hallaron diferencias estadísticas con el resto de los scores. Para todo tipo de cirugía, el Ontario tuvo el mejor índice de Shannon global (0,913), pero el peor índice de fallecidos (0,074), lo cual indica que otorgó riesgos esperados más bajos a los sobrevivientes, pero también riesgos bajos a los que murieron. Por su parte, el EuroSCORE se ubicó en segundo lugar para el índice global (0,905) y el de fallecidos (0,106). Para la cirugía coronaria, el Español tuvo el índice global más alto (0,945), pero también el índice de fallecidos más bajo (0,050), lo que señala una buena precisión en el primer caso y una mala precisión cuando sólo se consideran los fallecidos. En el EuroSCORE, los índices de Shannon de 0,926 y 0,073 lo ubican ligeramente en mejor posición al evaluar los dos tipos de valores. Conclusiones La comparación de siete scores para estratificar el riesgo de mortalidad en la cirugía cardíaca demostró que el EuroSCORE tuvo el mejor desempeño, tanto para los procedimientos valvulares como para los coronarios. Por su parte, el score del Español tuvo un desempeño similar cuando se consideraron todos los tipos de cirugía, mientras que el de Cleveland fue mejor para estratificar el riesgo de los coronarios. De acuerdo con el índice de Shannon, la precisión para predecir mortalidad a nivel del paciente individual fue pobre con todos los modelos.