ABSTRACT: Seed quality is routinely evaluated in the laboratory through germination and vigor tests. Although efficient, the available test methods have limitations, which are mainly associated with long evaluation times. We aimed to verify whether near-infrared (NIR) spectroscopy can categorize soybean seed lots and genotypes into predefined vigor classes based on physiological and biochemical analyses. The classes were defined based on analyses of physiological potential; the antioxidant enzymes activities; and the contents of malonaldehyde, oil and protein. The NIR spectra of individual seeds were obtained, preprocessed, and used for modeling. Classification models using the K-Nearest Neighbors (K-NN) method, Partial Least Squares Discriminant Analysis (PLS-DA), and Support Vector Machine (SVM) were obtained. The low-vigor seeds had higher malonaldehyde and oil contents and, in general, lower antioxidative enzyme activities. The best model to classify the seed quality reached 99% accuracy. The wave-length region from 1,000 to 1,250 nm was the most important for distinguishing the levels of soybean seed quality. ABSTRACT tests efficient limitations times nearinfrared near infrared (NIR potential activities protein obtained preprocessed modeling KNearest K Nearest KNN NN (K-NN method PLSDA, PLSDA PLS DA , (PLS-DA) SVM (SVM lowvigor low general 99 accuracy wavelength wave length 1000 1 000 1,00 1250 250 1,25 (PLS-DA 9 100 00 1,0 125 25 1,2 10 0 1, 12 2
RESUMO: A qualidade das sementes é rotineiramente avaliada em laboratório por meio de testes de germinação e vigor. Embora eficientes, os métodos disponíveis têm limitações, principalmente associadas ao longo tempo de avaliação. O objetivo deste estudo foi verificar se a espectroscopia no infravermelho próximo (NIR) pode categorizar lotes de sementes de soja e genótipos em classes de vigor predefinidas, com base em análises fisiológicas e bioquímicas. As classes foram definidas com base em análises do potencial fisiológico, da atividade de enzimas antioxidantes e dos teores de malonaldeído, óleo e proteína. Os espectros NIR de sementes individuais foram obtidos, pré-processados e utilizados para modelagem. Modelos de classificação utilizando o método K-Vizinhos Mais Próximos (K-NN), Análise Discriminante por Mínimos Quadrados Parciais (PLS-DA) e Máquina de Vetores de Suporte (SVM) foram obtidos. As sementes de baixo vigor apresentaram maiores teores de malonaldeído e óleo e, em geral, menores atividades de enzimas antioxidantes. O melhor modelo para classificar a qualidade das sementes alcançou 99% de precisão. A região de comprimento de onda de 1.000 a 1.250 nm foi a mais importante para distinguir os níveis de qualidade das sementes de soja. RESUMO eficientes limitações avaliação (NIR predefinidas bioquímicas fisiológico proteína obtidos préprocessados pré processados modelagem KVizinhos K Vizinhos KNN, KNN NN , (K-NN) PLSDA PLS DA (PLS-DA SVM (SVM geral 99 precisão 1000 1 000 1.00 1250 250 1.25 (K-NN 9 100 00 1.0 125 25 1.2 10 0 1. 12 2