VIGILÂNCIA EM SAÚDE: A IMPORTÂNCIA DA PADRONIZAÇÃO DE DADOS PARA CONTROLE DA PANDEMIA DA COVID-19

Autores

  • Manuela Leal da Silva Instituto de Biodiversidade e Sustentabilidade (NUPEM), Universidade Federal do Rio de Janeiro, Macaé,RJ
  • Maria Fernanda Ribeiro Dias Secretaria Estadual de Educação do Espírito Santo
  • Paula Lopes Cascabulho Universidade Católica de Petrópolis
  • Isadora Nogueira Camelo Instituto de Biodiversidade e Sustentabilidade (NUPEM), Universidade Federal do Rio de Janeiro, Macaé,RJ
  • Davi Ventura da Silva Instituto de Biodiversidade e Sustentabilidade (NUPEM), Universidade Federal do Rio de Janeiro, Macaé,RJ
  • Diego Henrique Silvestre Universidade Federal do Rio de Janeiro Campus UFRJ - Macaé , RJ
  • Evenilton Pessoa Costa Universidade Federal do Rio de Janeiro

Palavras-chave:

Vigilância genômica, SARS-CoV-2, Banco de dados, Bioinformática, Mineração de dados

Resumo

Neste trabalho, avaliamos a consistência na padronização dos dados genômicos depositados
no banco de dados GISAID, considerando os filtros disponíveis pela própria plataforma. Os dados
genômicos filtrados passaram por padronização dos rótulos das variáveis: “status do paciente”, “sexo”
e “idade”. Rótulos redundantes foram transformados e categorizados, conforme o objetivo deste
trabalho. Foram criados quatro rótulos (Vivo, Hospitalizado, Morto e Desconhecido) para a variável
“status do paciente”; três rótulos (Feminino, Masculino e Desconhecido) para a variável “sexo”; e dois
rótulos (apenas números reais e desconhecido) para a variável idade. Em seguida, analisamos o perfil
global de genomas de SARS-CoV-2 sequenciados e depositados no GISAID, separando-os por
continente. Analisamos também a distribuição de variantes do SARS-CoV-2 exclusivamente na
América do Sul, bem como a distribuição das VOC e VOI conforme a idade e sexo dos pacientes. Foi
feita uma análise quantitativa de sequências genômicas após aplicação dos filtros “localização
geográfica”, “genoma completo”, “hospedeiro” e “status do paciente”. Construímos um mapa de
distribuição das variantes de SARS-CoV-2 pela América do Sul, destacando a participação de cada
variante por todo o continente. Finalmente, mostramos a importância da vigilância genômica na
descoberta de novas variantes de SARS-CoV-2. Além disso, observamos que a ausência de
padronização no depósito de dados genômicos no GISAID levam a perda de uma quantidade valiosa de dados. Em suma, esperamos que esta compilação de dados seja útil para as políticas públicas de
saúde no controle da pandemia da COVID-19 e para a sociedade acadêmica como um todo. 

Downloads

Publicado

07/05/2024