Abstract Introduction: Molecular divergence thresholds have been proposed to distinguish recently separated evolutive units, often displaying more accurate putative species assignments in taxonomic research compared to traditional morphological approaches. This makes DNA barcoding an attractive identification tool for a variety of marine invertebrates, especially for cryptic species complexes. Although GenBank and the Barcode of Life Data System (BOLD) are the major sequence repositories worldwide, very few have tested their performance in the identification of echinoderm sequences. Objective: We use COI echinoderm sequences from local samples and the molecular identification platforms from GenBank and BOLD, in order to test their accuracy and reliability in the DNA barcoding identification for Central American shallow water echinoderms, at genus and species level. Methods: We conducted sampling, tissue extraction, COI amplification, sequencing, and taxonomic identification for 475 specimens. The 348 obtained sequences were individually enquired with BLAST in GenBank as well as using the Identification System (IDS) in BOLD. Query sequences were classified depending on the best match result. McNemar’s chi-squared, Kruskal-Wallis’s and Mann-Whitney’s U tests were performed to prove differences between the results from both databases. Additionally, we recorded an updated list of species reported for the shallow waters of the Central American Pacific. Results: We found 324 echinoderm species reported for Central American Pacific shallow waters. Only 118 and 110 were present in GenBank and BOLD databases respectively. We proposed 325 solved morphology-based identities and 21 provisional identifications in 50 putative taxa. GenBank retrieved 348 molecular-based identifications in 58 species, including twelve provisional identifications in tree taxa. BOLD recovered 170 COI identifications in 23 species with one provisional identification. Nevertheless, 178 sequences retrieved unmatched terms (in 34 morphology-based taxa). Only 86 sequences (25 %) were retrieved as correct identifications and 128 (37 %) as identification errors in both platforms. We include 84 sequences for eleven species not represented in GenBank and 65 sequences for ten species in BOLD Echinoderm COI databases. The identification accuracy using BLAST (175 correct and 152 incorrect identifications) was greater than with IDS engine (110 correct and 218 identification errors), therefore GenBank outperforms BOLD (Kruskal-Wallis = 41.625, df = 1, p < 0.001). Conclusions: Additional echinoderm sample references are needed to improve the utility of the evaluated DNA barcoding identification tools. Identification discordances in both databases may obey specific parameters used in each search algorithm engine and the available sequences. We recommend the use of barcoding as a complementary identification source for Central American Pacific shallow water echinoderm species.
Resumen Introducción: Se han propuesto los umbrales de divergencia molecular para distinguir unidades evolutivas recientemente separadas, que a menudo muestran asignaciones de especies putativas más precisas en la investigación taxonómica en comparación con los enfoques morfológicos tradicionales. Esto hace que los Códigos de Barras de ADN sean una herramienta de identificación atractiva para una variedad de invertebrados marinos, especialmente para complejos de especies crípticas. Aunque GenBank y Barcode of Life Data System (BOLD) son los principales repositorios de secuencias en todo el mundo, muy pocos han probado su desempeño en la identificación de secuencias de equinodermos. Objetivo: Utilizamos secuencias de equinodermos COI de muestras locales y las plataformas de identificación molecular de GenBank y BOLD, para probar su precisión y confiabilidad en la implementación de códigos de barras de ADN para equinodermos de aguas someras de Centroamérica, a nivel de género y especie. Métodos: Realizamos muestreo, extracción de tejido, amplificación de COI, secuenciación e identificación taxonómica de 475 especímenes. Las 348 secuencias obtenidas fueron consultadas individualmente con BLAST en GenBank así como utilizando el Sistema de Identificación (IDS) en BOLD. Las secuencias consultadas se clasificaron según el mejor resultado de coincidencia. Se realizaron las pruebas chi-cuadrado de McNemar, Kruskal-Wallis y U de Mann-Whitney para comprobar diferencias entre los resultados de ambas bases de datos. Además, registramos una lista actualizada de especies reportadas para las aguas someras del Pacífico Centroamericano. Resultados: Encontramos 324 especies de equinodermos reportadas para aguas someras (< 200 m) del Pacífico centroamericano. Sólo 118 y 110 estaban presentes en las bases de datos GenBank y BOLD respectivamente. Propusimos 325 identidades resueltas basadas en morfología y 21 identificaciones provisionales en 50 taxones putativos. GenBank recuperó 348 identificaciones de base molecular en 58 especies, incluidas doce identificaciones provisionales en tres taxones. BOLD recuperó 170 identificaciones de COI en 23 especies con una identificación provisional. Sin embargo, 178 secuencias recuperaron términos no coincidentes (en 34 taxones basados en morfología). Sólo 86 secuencias (25 %) se recuperaron como identificaciones correctas y 128 (37 %) como errores de identificación en ambas plataformas. Incluimos 84 secuencias para once especies no representadas en GenBank y 65 secuencias para diez especies ausentes en las bases de datos BOLD Echinoderm COI. La precisión de la identificación usando BLAST (175 identificaciones correctas y 152 incorrectas) fue mayor que con el motor IDS (110 correctas y 218 errores de identificación), por lo tanto, GenBank supera a BOLD (Kruskal-Wallis = 41.625, df = 1, p < 0.001). Conclusiones: Se necesitan muestras adicionales de equinodermos de referencia para mejorar la utilidad de las herramientas de identificación de códigos de barras de ADN evaluadas. Las discordancias de identificación en ambas bases de datos pueden obedecer a parámetros específicos utilizados en cada algoritmo de búsqueda y a las secuencias disponibles. Recomendamos el uso de códigos de barras como fuente de identificación complementaria para las especies de equinodermos de aguas someras del Pacífico centroamericano.