Resumo O objetivo deste trabalho foi avaliar a influência da resolução espacial do modelo digital de elevação e da eficiência de modelos Random Forest sobre a predição dos teores de areia, argila e carbono orgânico, com uso de número reduzido de amostras. O trabalho foi realizado em área de Cerrado com diversidade litológica, no Estado do Mato Grosso do Sul, tendo-se utilizado atributos morfométricos, dados do sensor TM Landsat 5 e litologia como covariáveis preditoras. Dados da camada superficial (0,0-0,2 m) de 175 perfis de solos (0,009 perfis km-2) e de 26 covariáveis preditoras foram utilizados com resolução espacial de 30 (conjunto 1) e 90 m (conjunto 2). A análise realizada pelo Random Forest mostrou que as covariáveis de nível de base do canal de drenagem, da elevação e da litologia foram as mais importantes para explicar a variabilidade. A validação dos modelos apresentou similaridade entre os conjuntos quanto à predição de areia, argila e carbono orgânico, o que explica os seguintes valores de variabilidade espacial, respectivamente: 44, 40 e 33%, para a resolução de 30 m; e de 45, 46 e 33%, para a resolução de 90 m. A resolução espacial das covariáveis preditoras tem pouca influência sobre a predição dos atributos, e a abordagem por Random Forest apresenta potencial de utilização para estimar atributos do solo.
Abstract The objective of this work was to evaluate the effect of the digital elevation model spatial resolution and of the efficiency of Random Forest models on the prediction of sand, clay, and organic carbon contents, using few soil samples. The study was carried out in a Cerrado area with lithological diversity, in the state of Mato Grosso do Sul, Brazil, using morphometric attributes, TM Landsat 5 sensor data, and lithology as predictive covariates. The surface layer data (0.0-0.2 m) of 175 soil profiles (0,009 profiles km-2) and of 26 predictor covariates were used with 30 (set 1) and 90-m (set 2) spatial resolutions. The performed analysis by Random Forest models showed that channel base level, elevation, and lithology were the most important ones to explain the variability. The validation of the models showed similarity among sets for the prediction of sand, clay, and organic carbon contents, which explains the following values of spatial variability, respectively: 44, 40, and 33%, for the spatial resolution of 30 m; and 45, 46, and 33%, for the spatial resolution of 90 m. The spatial resolution of the predictive covariates has little effect on attribute predictions, and the Random Forest approach has potential use for estimating soil properties.