Questões de Concurso Público INCA 2010 para Tecnologista Júnior – Bioinformática
Foram encontradas 11 questões
O formato FASTA é composto por uma linha de comentário iniciada por “>”; pela sequência biológica; e por um "*" opcional, que marca o final da sequência.
O MSS (multiple sequence standard) é um formato comum para alinhamentos múltiplos de sequências.
O AceDB foi um dos primeiros bancos de dados genômicos.
O NCBI (National Center for Biotechnology Information) mantém o GenBank, que é uma coleção anotada de sequências de DNA disponíveis publicamente.
A base de dados nr é mantida pelo NCBI, e sua sigla significa new and representative.
O DDBJ, o EMBL e o GenBank são os mais importantes bancos de dados públicos de informação genômica e são sincronizados diariamente.
Anotação genômica é o processo de predição funcional de genes com base em comparações com bancos de dados.
No banco de dados de ESTs (etiquetas de sequências expressas) armazenado no GenBank, estão estocadas sequências curtas de cerca de 200 a 500 nucleotídeos e identificadas como únicas em um genoma resultante de um amplicon pela reação da polimerase em cadeia (PCR).
As bases de dados COG e KOG são bases de dados de proteínas ortólogas de organismos procariotos (COG) e eucariotos (KOG).
No banco de dados Genbank, a subdivisão RefSeq é uma coleção curada de sequências redundantes de dados de DNA genômico, transcritos e proteínas.
Um banco de dados pode ser considerado uma coleção de dados inter-relacionados, projetado para suprir as necessidades de um grupo específico de aplicações e usuários.