Abstract: The identification of seeds from native species is a complex assessment due to the high Brazilian biodiversity and varied characteristics between species. The objective was to apply different machine learning classifiers associated with image analysis to identify seeds of forest species. In total, 155 native species belonging to 42 botanical families were analyzed. In addition, to determine the appropriate machine learning classifier, five supervised learning classification techniques were implemented: decision trees (DT), artificial neural networks (ANN), k-nearest neighbors (k-NN), Naive-Bayes classifier (NBC) and support vector machine (SVM), which had their performance evaluated. For modeling, 66% of the seeds’ morphobiometric data were used to train the classifiers, while 34% were reserved for validation. The classifiers are promising tools for identifying species from seed images. The decision tree (DT) classifier showed greater accuracy for correct species identification (82.8%), followed by ANN (81.7%), k-NN (81.7%), NBC (81.1%) and SVM (78.7%). Therefore, it is possible to identify seeds of native species from images and machine learning with a satisfactory accuracy rate. Finally, the decision tree classifier is recommended. Abstract total 15 4 analyzed addition implemented DT, DT , ANN, (ANN) knearest k nearest kNN, kNN NN (k-NN) NaiveBayes Naive Bayes (NBC SVM, (SVM) evaluated modeling 66 34 validation (DT 82.8%, 828 82.8% 82 8 (82.8%) 81.7%, 817 81.7% 81 7 (81.7%) 81.1% 811 1 (81.1% 78.7%. 787 78.7% . 78 (78.7%) Therefore rate Finally recommended (ANN (k-NN (SVM 6 3 82.8 (82.8% 81.7 (81.7% 81.1 (81.1 78.7 (78.7% 82. (82.8 81. (81.7 (81. 78. (78.7 (82. (81 (78. (82 (8 (78 ( (7
Resumo: A identificação de sementes de espécies nativas é uma avaliação complexa devido a elevada biodiversidade brasileira e características variadas entre as espécies. Objetivou-se aplicar diferentes classificadores de aprendizado de máquina associado à análise de imagens para identificar sementes de espécies florestais. Foram analisadas 155 espécies nativas pertencentes a 42 famílias botânicas. Para determinar o classificador de aprendizado de máquina adequado, cinco técnicas de classificação por aprendizado supervisionado foram implementadas: árvores de decisão (DT), redes neurais artificiais (ANN), k-vizinhos mais próximos (k-NN), classificador Naive-Bayes (NBC) e máquina de vetores de suporte (SVM), os quais tiveram seu desempenho avaliados. Para modelagem, 66% dos dados morfobiométricos das sementes foram usados para treinamento dos classificadores, enquanto 34% foram reservados para validação. Os classificadores são ferramentas promissoras para a identificação de espécies a partir das imagens de sementes. O classificador por árvores de decisão (DT) apresentou maior acurácia para identificação correta das espécies (82,8%), seguido dos classificadores ANN (81,7%), k-NN (81,7%), NBC (81,1%) e SVM (78,7%). Portanto, é possível realizar a identificação de sementes de espécies nativas a partir de imagens e aprendizado de máquina com taxa satisfatória de acurácia. Recomenda-se o classificador por árvores de decisão. Resumo Objetivouse Objetivou se florestais 15 4 botânicas adequado implementadas DT, DT , ANN, (ANN) kvizinhos k vizinhos kNN, kNN NN (k-NN) NaiveBayes Naive Bayes (NBC SVM, (SVM) avaliados modelagem 66 34 validação (DT 82,8%, 828 82,8% 82 8 (82,8%) 81,7%, 817 81,7% 81 7 (81,7%) 81,1% 811 1 (81,1% 78,7%. 787 78,7% . 78 (78,7%) Portanto Recomendase Recomenda (ANN (k-NN (SVM 6 3 82,8 (82,8% 81,7 (81,7% 81,1 (81,1 78,7 (78,7% 82, (82,8 81, (81,7 (81, 78, (78,7 (82, (81 (78, (82 (8 (78 ( (7