Abstract This paper presents a dataset construction and data science analysis from the literature results of physicochemical characterization of ordinary Portland cement (OPC). The physicochemical variables included the percentage by mass of calcium oxide (CaO), silicon dioxide (SiO2), aluminum oxide (Al2O3), iron oxide (Fe2O3), magnesium oxide (MgO), sulfuric oxide (SO3), sodium oxide (Na2O), potassium oxide (K2O), titanium oxide (TiO2), free lime (CaOfree), equivalent alkaline (Na2Oeq), loss on ignition, specific surface, density, water-cement ratio, and compressive strength of cement at 28 days. The searching, collection, and assembly of the dataset aimed to evaluate the information related to those variables through exploratory data analysis, enabling a basic understanding of characterization results of OPCs obtained in publications from different types, sources, years, and countries. The dataset provides a useful source of physicochemical characterization of ordinary cement, and the exploratory data analysis provided an understanding of central, dispersion, and data distribution with statistical metrics of each variable and their pair-wise correlations in the assembled dataset. The constructed dataset and its analysis are a starting point to further data, studies, and artificial intelligence models to provide a broader global view of the production and properties of ordinary Portland cement.
Resumo Este artigo apresenta a construção de um conjunto de dados e a análise exploratória de dados a partir dos resultados da literatura de caracterização físico-química do cimento Portland comum (CPC). As variáveis físico-químicas incluíram a porcentagem em massa de óxido de cálcio (CaO), dióxido de silício (SiO2), óxido de alumínio (Al2O3), óxido de ferro (Fe2O3), óxido de magnésio (MgO), óxido sulfúrico (SO3), óxido de sódio (Na2O), óxido de potássio (K2O), óxido de titânio (TiO2), cal livre (CaOfree), equivalente alcalino (Na2Oeq), perda ao fogo, superfície específica, densidade, relação água-cimento e resistência à compressão do cimento aos 28 dias. A busca, coleta e montagem do conjunto de dados teve como objetivo avaliar as informações relacionadas a essas variáveis por meio de análise exploratória de dados, permitindo uma compreensão básica dos resultados de caracterização de CPCs obtidos em publicações de diferentes tipos, fontes, anos e países. O conjunto de dados fornece uma fonte útil de caracterização físico-química de cimento comum, e a análise exploratória de dados forneceu uma compreensão da distribuição central, de dispersão e de dados com métricas estatísticas de cada variável e suas correlações de pares no conjunto de dados montado. O conjunto de dados construído e sua análise são um ponto de partida para novos dados, estudos e modelos de inteligência artificial para fornecer uma visão global mais ampla da produção e propriedades do cimento Portland comum.