摘要 目的 开发2005年国家级疾病发病率缺失数据透明和可重复的填补方法。 方法 我们比较填补两种食源性疾病的缺失国家级发病率的几种模型:先天性弓形体病和黄曲霉毒素相关的肝细胞癌。假定缺失值是随机缺失。使用最小一乘收缩和选择算子(LASSO)回归来选择预...
Резюме Цель Разработать прозрачные и воспроизводимые методы ввода отсутствующих данных о распространенности заболевания на национальном уровне за 2005 год...
Résumé Objectif Développer des méthodes transparentes et reproductibles pour imputer les données manquantes sur l'incidence d'une maladie au niveau national pour l'année 2005. Méthodes Nous avons comparé plusieurs modèles pour imputer les taux d'incidence manquants au niveau national pour deux maladies d'origine alimentaire: la toxoplasmose congénitale et le carcinome hépatocellulaire lié à l'aflatoxine. Les valeurs manquantes sont supposées être manquantes au hasard. Les variables prédictives ont été sélectionnées en utilisant la régression LASSO ( least absolute shrinkage and selection operator ). Nous avons comparé la performance prédictive des approches d'extrapolation naïves et les modèles de régression à effets aléatoires et mixtes bayé...
Objective To develop transparent and reproducible methods for imputing missing data on disease incidence at national-level for the year 2005. Methods We compared several models for imputing missing country-level incidence rates for two foodborne diseases – congenital toxoplasmosis and aflatoxin-related hepatocellular carcinoma. Missing values were assumed to be missing at random. Predictor variables were selected using least absolute shrinkage and selection operator regression. We compared the predictive performance of naive extrapolation approaches and Bayesian random and mixed-effects regression models. Leave-one-out cross-validation was used to evaluate model accuracy. Findings The predictive accuracy of the Bayesian mixed-effects models was significantly better than that of the naive extrapolation method for one of the two disease models. However, Bayesian mixed-effects models produced wider prediction intervals for both data sets. Conclusion Several approaches are available for imputing missing data at national level. Strengths of a hierarchical regression approach for this type of task are the ability to derive estimates from other similar countries, transparency, computational efficiency and ease of interpretation. The inclusion of informative covariates may improve model performance, but results should be appraised carefully.
ملخص الغرض وضع أساليب تتميز بالشفافية وقابلية التكرار لاحتساب البيانات المفقودة بشأن الإصابة بالمرض على الصعيد الوطني لعام 2005. الطريقة قمنا بمقارنة نماذج...
Resumen Objetivo Desarrollar métodos transparentes y reproducibles de imputación de datos ausentes sobre la incidencia de la morbilidad a nivel nacional para el año 2005. Métodos Se compararon varios modelos de imputación de las tasas ausentes de incidencia a nivel nacional para dos enfermedades transmitidas por los alimentos, la toxoplasmosis congénita y el carcinoma hepatocelular relacionado con la aflatoxina. Se consideró que los valores ausentes faltaban al azar. Las variables de predicción se seleccionaron por medio de la contracción absoluta mínima y la regresión del operador de la selección. Se comparó el rendimiento predictivo de los enfoques de extrapolación ingenua y los modelos bayesianos de regresión al azar y de efectos mixtos, y se empleó una validación cruzada dejando uno fuera para evaluar la exactitud del modelo. Resultados La exactitud predictiva de los modelos bayesianos de efectos mixtos fue significativamente mejor que la del método de extrapolación ingenua para uno de los dos modelos de enfermedad. Sin embargo, los modelos bayesianos de efectos mixtos generaron intervalos de predicción más amplios para ambos conjuntos de datos. Conclusión Son numerosos los enfoques disponibles para la imputación de datos ausentes a nivel nacional. Los puntos fuertes de un enfoque de regresión jerárquica para este tipo de tareas son la capacidad de obtener estimaciones de otros países similares, la transparencia, la eficiencia informática y la facilidad de interpretación. La inclusión de covariables informativas puede mejorar el rendimiento del modelo, aunque se deben evaluar atentamente los resultados.