O objetivo deste trabalho foi agrupar, por semelhança, perfis temporais do produto NDVI decendial, obtido pelo sensor SPOT Vegetation, para os municípios produtores de soja no Estado do Paraná, na safra agrícola de 2005/2006. A Mineração de Dados é uma ferramenta valiosa que permite extrair conhecimento de uma base de dados, identificando padrões válidos, novos, potencialmente úteis e compreensíveis. Neste sentido, adotou-se a abordagem de geração dos clusters pelos algoritmos K-Means, MAXVER e DBSCAN no software WEKA. Foram gerados clusters com base no perfil temporal médio de NDVI dos 277 municípios produtores de soja do Estado, e os melhores resultados foram encontrados com o algoritmo K-Means, agrupando os municípios em seis clusters, utilizando o período do início de outubro ao final de março, equivalente ao ciclo vegetativo da cultura. Metade dos clusters gerados apresentou padrão espectro-temporal característico de soja e esteve, em sua grande maioria, sob o cinturão da soja do Estado do Paraná, demonstrando os bons resultados encontrados com a metodologia proposta, em termos de identificação de áreas homogêneas. Estes resultados serão úteis na geração de "máscaras" de soja regionalizadas para estimativa de área plantada desta cultura.
The aim of this study was to group temporal profiles of 10-day composites NDVI product by similarity, which was obtained by the SPOT Vegetation sensor, for municipalities with high soybean production in the state of Paraná, Brazil, in the 2005/2006 cropping season. Data mining is a valuable tool that allows extracting knowledge from a database, identifying valid, new, potentially useful and understandable patterns. Therefore, it was used the methods for clusters generation by means of the algorithms K-Means, MAXVER and DBSCAN, implemented in the WEKA software package. Clusters were created based on the average temporal profiles of NDVI of the 277 municipalities with high soybean production in the state and the best results were found with the K-Means algorithm, grouping the municipalities into six clusters, considering the period from the beginning of October until the end of March, which is equivalent to the crop vegetative cycle. Half of the generated clusters presented spectro-temporal pattern, a characteristic of soybeans and were mostly under the soybean belt in the state of Paraná, which shows good results that were obtained with the proposed methodology as for identification of homogeneous areas. These results will be useful for the creation of regional soybean "masks" to estimate the planted area for this crop.