ABSTRACT Purpose: This study aimed to evaluate the classification performance of pretrained convolutional neural network models or architectures using fundus image dataset containing eight disease labels. Methods: A publicly available ocular disease intelligent recognition database has been used for the diagnosis of eight diseases. This ocular disease intelligent recognition database has a total of 10,000 fundus images from both eyes of 5,000 patients for the following eight diseases: healthy, diabetic retinopathy, glaucoma, cataract, age-related macular degeneration, hypertension, myopia, and others. Ocular disease classification performances were investigated by constructing three pretrained convolutional neural network architectures including VGG16, Inceptionv3, and ResNet50 models with adaptive moment optimizer. These models were implemented in Google Colab, which made the task straight-forward without spending hours installing the environment and supporting libraries. To evaluate the effectiveness of the models, the dataset was divided into 70%, 10%, and 20% for training, validation, and testing, respectively. For each classification, the training images were augmented to 10,000 fundus images. Results: ResNet50 achieved an accuracy of 97.1%; sensitivity, 78.5%; specificity, 98.5%; and precision, 79.7%, and had the best area under the curve and final score to classify cataract (area under the curve = 0.964, final score = 0.903). By contrast, VGG16 achieved an accuracy of 96.2%; sensitivity, 56.9%; specificity, 99.2%; precision, 84.1%; area under the curve, 0.949; and final score, 0.857. Conclusions: These results demonstrate the ability of the pretrained convolutional neural network architectures to identify ophthalmological diseases from fundus images. ResNet50 can be a good architecture to solve problems in disease detection and classification of glaucoma, cataract, hypertension, and myopia; Inceptionv3 for age-related macular degeneration, and other disease; and VGG16 for normal and diabetic retinopathy. Purpose labels Methods 10000 10 000 10,00 5000 5 5,00 healthy retinopathy glaucoma agerelated age related degeneration hypertension myopia others VGG Inceptionv ResNet ResNet5 optimizer Colab straightforward straight forward libraries 70 70% 10% 20 validation testing respectively Results 97.1% 971 97 1 sensitivity 78.5% 785 78 specificity 98.5% 985 98 precision 797 79 7 79.7% 0964 0 964 0.964 0.903. 0903 0.903 . 903 0.903) contrast VGG1 96.2% 962 96 2 56.9% 569 56 9 99.2% 992 99 84.1% 841 84 0.949 0949 949 0857 857 0.857 Conclusions 1000 00 10,0 500 5,0 97.1 78.5 98.5 79.7 096 0.96 090 0.90 90 96.2 56.9 99.2 84.1 8 0.94 094 94 085 85 0.85 100 10, 50 5, 97. 78. 98. 79. 09 0.9 96. 56. 99. 84. 08 0.8 0.
RESUMO Objetivo: Avaliar o desempenho de classificação de modelos ou arquiteturas de rede neural convolucional pré--treinadas usando um conjunto de dados de imagem de fundo de olho contendo oito rótulos de doenças diferentes. Métodos: Neste artigo, o conjunto de dados de reconhecimento inteligente de doenças oculares publicamente disponível foi usado para o diagnóstico de oito rótulos de doenças diferentes. O banco de dados de reconhecimento inteligente de doenças oculares tem um total de 10.000 imagens de fundo de olho de ambos os olhos de 5.000 pacientes para oito categorias que contêm rótulos saudáveis, retinopatia diabética, glaucoma, catarata, degeneração macular relacionada à idade, hipertensão, miopia, outros. Investigamos o desempenho da classificação de doenças oculares construindo três arquiteturas de rede neural convolucional pré-treinadas diferentes, incluindo os modelos VGG16, Inceptionv3 e ResNet50 com otimizador de Momento Adaptativo. Esses modelos foram implementados no Google Colab o que facilitou a tarefa sem gastar horas instalando o ambiente e suportando bibliotecas. Para avaliar a eficácia dos modelos, o conjunto de dados é dividido em 70% para treinamento, 10% para validação e os 20% restantes utilizados para teste. As imagens de treinamento foram expandidas para 10.000 imagens de fundo de olho para cada tal. Resultados: Observou-se que o modelo ResNet50 alcançou acurácia de 97,1%, sensibilidade de 78,5%, especificidade de 98,5% e precisão de 79,7% e teve a melhor área sob a curva e pontuação final para classificar a categoria da catarata (área sob a curva=0,964, final=0,903). Em contraste, o modelo VGG16 alcançou uma precisão de 96,2%, sensibilidade de 56,9%, especificidade de 99,2% e precisão de 84,1%, área sob a curva 0,949 e pontuação final de 0,857. Conclusão: Esses resultados demonstram a capacidade das arquiteturas de rede neural convolucional pré-treinadas em identificar doenças oftalmológicas a partir de imagens de fundo de olho. ResNet50 pode ser uma boa solução para resolver problemas na detecção e classificação de doenças como glaucoma, catarata, hipertensão e miopia; Inceptionv3 para degeneração macular relacionada à idade e outras doenças; e VGG16 para retinopatia normal e diabética. Objetivo prétreinadas pré treinadas diferentes Métodos artigo 10000 10 000 10.00 5000 5 5.00 saudáveis diabética glaucoma miopia outros VGG Inceptionv ResNet ResNet5 Adaptativo bibliotecas 70 20 teste tal Resultados Observouse Observou se 971 97 1 97,1% 785 78 78,5% 985 98 98,5 797 79 7 79,7 curva0964 0 964 curva=0,964 final=0,903. final0903 final=0,903 . 903 final=0,903) contraste VGG1 962 96 2 96,2% 569 56 9 56,9% 992 99 99,2 841 84 84,1% 0949 949 0,94 0857 857 0,857 Conclusão 1000 00 10.0 500 5.0 97,1 78,5 98, 79, curva096 curva=0,96 final090 final=0,90 90 96,2 56,9 99, 8 84,1 094 94 0,9 085 85 0,85 100 10. 50 5. 97, 78, curva09 curva=0,9 final09 final=0,9 96, 56, 84, 09 0, 08 0,8 curva0 curva=0, final0 final=0, curva=0 final=0 curva= final=