Os marcadores microssatélites são ferramentas úteis em diversas análises genéticas em plantas. No caso do mamoeiro (Carica papaya L.), poucos locos de microssatélites foram descritos até o momento. Assim, o objetivo deste trabalho foi explorar a base de dados do GenBank / NCBI (National Center of Biotechnoloy Information) à procura de microssatélites de mamoeiro, visando a seu futuro uso em estudos genéticos e moleculares aplicados ao melhoramento genético. As seqüências foram obtidas no GenBank / NCBI, no formato FASTA, e analisadas para a presença de microssatélites com um mínimo de 20; 7 e 5 repetições dos motivos de mono-, di- e trinucleotídeos, respectivamente, e acima de 4 repetições para tetra- e pentanucleotídeos. Seqüências com mais de 90% de similaridade foram consideradas redundantes e, portanto, eliminadas das análises. Foram analisadas 44.591 seqüências, das quais 3.180 foram não-redundantes e apresentaram 3.947 microssatélites. Desse total, 3.587 foram classificados como microssatélites perfeitos, 8 imperfeitos, 65 interrompidos, 239 compostos-perfeitos, 8 compostos-imperfeitos e 40 compostos-interrompidos. As repetições de di- e trinucleotídeos representaram 65,7 e 14,4% do total de seqüências analisadas, respectivamente. Somente os motivos do tipo AT/TA representaram 44,1% dos microssatélites encontrados. Os motivos mais comuns de tri-, tetra- e pentanucleotídeos foram AAT, AATT e TTTAA, respectivamente. Observou-se que, nas seqüências disponíveis, o genoma do mamoeiro apresenta, em média, um microssatélite a cada 5,65 kb.
Microsatellites markers are a useful tool in much plant genetic analysis. Currently, few microsatellites loci have been reported in Carica papaya L.. Therefore, the objective of this study was accomplishing a search for microsatellites in the public available - GenBank / NCBI (National Center of Biotechnology Information), aiming the future use in molecular and genetic studies applied to genetic breeding. The sequences were collected from GenBank / NCBI in FASTA-formatted files and analyzed for the presence of microsatellites with a minimum of 20, 7 and 5 repetitions of mono-, di- and trinucleotides, respectively, and above of 4 repetitions for tetra- and pentanucleotides. The sequences with over 90% of similarity, were considered redundant and, therefore, eliminated of the analyses. A total of 44,591 sequences had been analyzed, of which 3,180 were not redundant, showing 3,947 microsatellites. Out of those, 3,587 were classified as perfect, 8 imperfects, 65 interrupted, 239 perfect-compounds, 8 imperfect-compounds and 40 interrupted-compounds. The dinucleotides and trinucleotides repetitions represented 65.7 and 14.4% of the whole analyzed sequences, respectively. Only the AT/TA motif represented 44.1% of the microsatellites sequences. The most common motifs of tri-, tetra- and pentanucleotides were AAT, AATT and TTTAA, respectively. In the available sequences it can be observed that the papaya genome has an average one microsatellite for every 5,65 kb.