RESUMO Com a crescente produção de soja no Brasil e a demanda por grãos de soja com alto teor de proteína e óleo, é fundamental o estudo aprofundado dos constituintes desse grão, os quais podem variar de acordo com os genótipos e as condições de cultivo. Com isso, o objetivo desse estudo foi realizar a classificação de genótipos de soja, cultivados em diferentes ambientes e épocas de semeadura, de acordo com a composição química e o espectro gerado por infravermelho próximo (NIRs). Para isso, foi empregada a inteligência artificial e sua técnica de aprendizado de máquina. Foram utilizados 10 genótipos de soja, semeados em duas épocas de semeadura e em 7 cidades do Rio Grande do Sul. A composição química das amostras foi analisada através do equipamento FOSS NIRS DS2500, selecionando a banda entre 807 e 817nm. Os algoritmos aplicados foram J48, Random Forest, CVR, lBk, MLP, utilizando o filtro Resample. Foi empregado o software Weka, versão 3.8.6, para mineração de dados. O algoritmo IBk conseguiu o melhor desempenho, alcançando 89% de classificação correta dos atributos. A partir da Matriz de Confusão, observou-se que todos os genótipos obtiveram resultados superiores a 60/70 para os valores preditos corretamente, destacando o bom desempenho dos algoritmos. Nas métricas, o IBk obteve 0,89 de Precisão, Recall e F-Measure, e 0,94 de ROC Area. Foi possível classificar os genótipos, de acordo com a sua composição química relacionada aos dados obtidos na curva espectral, época e ambiente de semeadura, a partir da inteligência artificial e aprendizado de máquina. óleo grão cultivo isso NIRs. NIRs . (NIRs) máquina 1 Sul DS2500 DS 80 817nm nm J48 J Forest CVR lBk MLP Resample Weka 386 3 8 6 3.8.6 89 atributos Confusão observouse observou se 6070 60 70 60/7 corretamente métricas 089 0 0,8 Precisão FMeasure, FMeasure F Measure, Measure F-Measure 094 94 0,9 Area espectral (NIRs DS250 J4 38 3.8. 607 60/ 08 0, 09 9 DS25 3.8 DS2 3.
ABSTRACT With the increasing soybean production in Brazil, and the demand for soybeans with high protein and oil content, it is essential to conduct an in-depth study of the constituents of this grain, which can vary according to genotypes and growing conditions. Therefore, the objective of this study was to classify soybean genotypes, cultivated in different environments and sowing seasons, according to their chemical composition and the spectrum generated by near-infrared spectroscopy (NIRS). For this purpose, artificial intelligence and its machine learning technique were employed. 10 soybean genotypes were used, sown in two sowing seasons and cultivated 7 cities in Rio Grande do Sul. The chemical composition of the samples was analyzed using the FOSS NIRS DS2500 equipment, selecting the band between 807 and 817 nm. The applied algorithms were J48, Random Forest, CVR, lBk, MLP, using the Resample filter. The Weka software, version 3.8.6, was employed for data mining. The IBk algorithm achieved the best performance, reaching 89% correct classification of attributes. From the Confusion Matrix, it was observed that all genotypes obtained results above 60/70 for correctly predicted values, highlighting the algorithms’ good performance. In the metrics, IBk achieved 0.89 Precision, Recall, and F-Measure, and 0.94 ROC Area. Thus, it was possible to classify the genotypes according to their chemical composition related to the data obtained in the spectral curve, sowing season, and environment, using artificial intelligence and machine learning. Brazil content indepth depth grain conditions Therefore nearinfrared near infrared NIRS. . (NIRS) purpose 1 used Sul DS DS250 equipment 80 81 nm J48 J Forest CVR lBk MLP filter software 386 3 8 6 3.8.6 mining performance 89 attributes Matrix 6070 60 70 60/7 values metrics 089 0 0.8 Precision Recall FMeasure, FMeasure F Measure, Measure F-Measure 094 94 0.9 Area Thus curve season environment (NIRS DS25 J4 38 3.8. 607 60/ 08 0. 09 9 DS2 3.8 3.