ABSTRACT OBJECTIVE This study aims to integrate the concepts of planetary health and big data into the Donabedian model to evaluate the Brazilian dengue control program in the state of São Paulo. METHODS Data science methods were used to integrate and analyze dengue-related data, adding context to the structure and outcome components of the Donabedian model. This data, considering the period from 2010 to 2019, was collected from sources such as Department of Informatics of the Unified Health System (DATASUS), the Brazilian Institute of Geography and Statistics (IBGE), WorldClim, and MapBiomas. These data were integrated into a Data Warehouse. K-means algorithm was used to identify groups with similar contexts. Then, statistical analyses and spatial visualizations of the groups were performed, considering socioeconomic and demographic variables, soil, health structure, and dengue cases. OUTCOMES Using climate variables, the K-means algorithm identified four groups of municipalities with similar characteristics. The comparison of their indicators revealed certain patterns in the municipalities with the worst performance in terms of dengue case outcomes. Although presenting better economic conditions, these municipalities held a lower average number of community healthcare agents and basic health units per inhabitant. Thus, economic conditions did not reflect better health structure among the three studied indicators. Another characteristic of these municipalities is urbanization. The worst performing municipalities presented a higher rate of urban population and human activity related to urbanization. CONCLUSIONS This methodology identified important deficiencies in the implementation of the dengue control program in the state of São Paulo. The integration of several databases and the use of Data Science methods allowed the evaluation of the program on a large scale, considering the context in which activities are conducted. These data can be used by the public administration to plan actions and invest according to the deficiencies of each location. Paulo denguerelated 201 2019 DATASUS, DATASUS , (DATASUS) IBGE, IBGE (IBGE) WorldClim MapBiomas Warehouse Kmeans K means contexts Then performed variables soil cases characteristics outcomes inhabitant Thus urbanization scale conducted location 20 (DATASUS (IBGE 2
RESUMO OBJETIVO Integrar os conceitos de Saúde Planetária e Big Data ao modelo de Donabedian, para avaliar o Programa de Combate à Dengue no estado de São Paulo. MÉTODOS Foram adotados métodos de Ciência de Dados para integração e análise de dados relacionados à dengue, agregando o contexto aos componentes de estrutura e de resultado do modelo de Donabedian. Esses dados, considerando o período de 2010 a 2019, foram coletados de fontes como Datasus, Instituto Brasileiro de Geografia e Estatística (IBGE), WorldClim e MapBiomas, e integrados em um Data Warehouse. Para a identificação de grupos com contextos similares, foi utilizado o algoritmo K-means. Em seguida, foram realizadas análises estatísticas e visualizações espaciais dos grupos, considerando variáveis socioeconômicas, demográficas, solo, estrutura de saúde e casos de dengue. RESULTADOS Com o uso das variáveis climáticas, o algoritmo K-means identificou quatro grupos de municípios com características similares. A comparação dos seus indicadores revelou certos padrões nos municípios com pior desempenho quanto aos resultados de casos de dengue. Embora tivessem melhores condições econômicas, eles tinham menor número médio de agentes comunitários e de unidades básicas de saúde por habitante. Dessa forma, as condições econômicas não refletiram em melhor estrutura de saúde nos três indicadores avaliados. Outra característica desses municípios é a urbanização. Os municípios de pior desempenho tinham maior taxa de população urbana e de modificações antrópicas relacionadas à urbanização. CONCLUSÕES Por meio desta metodologia, foi possível identificar importantes deficiências nas condições para a execução do programa de combate à dengue no estado de São Paulo. A integração de diversas bases de dados e a utilização de métodos de Ciência de Dados permitiram a avaliação do programa em larga escala, considerando o contexto em que as ações são executadas. Dessa forma, a gestão pública pode utilizar as informações coletadas para planejar ações e investir de acordo com as deficiências de cada local. Donabedian Paulo 201 2019 Datasus IBGE, IBGE , (IBGE) MapBiomas Warehouse similares Kmeans. Kmeans K means. means seguida socioeconômicas demográficas solo climáticas habitante forma avaliados urbanização metodologia escala executadas local 20 (IBGE 2