Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/30201
Título: Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo
Autor(es): Pereira, Hudson
Orientador(es): Paschoal, Alexandre Rossi
Palavras-chave: Ácido ribonucleico - Síntese
Autismo
Bioinformática
RNA - Synthesis
Autism
Bioinformatics
Data do documento: 8-Abr-2022
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Cornelio Procopio
Citação: PEREIRA, Hudson. Análise de dados públicos de expressão gênica de distúrbios do espectro do autismo. 2022. Dissertação (Mestrado em Bioinformática) - Universidade Tecnológica Federal do Paraná, Cornélio Procópio, 2022.
Resumo: A síndrome do Transtorno do Espectro do Autismo (TEA) é caracterizada por dificuldades de interação, desvio na comunicação e comportamentos repetitivos. Essa síndrome também é definida como perda de contato com a realidade, causada por impossibilidade ou grande dificuldade na comunicação interpessoal. O TEA pode ser classificado de acordo com a gravidade em: leve, moderado e grave. O diagnóstico precoce do autismo é essencial para um tratamento eficaz. As análises transcriptomicas são um meio de obter informações regulatórias para entender o TEA. Nesse sentido, este trabalho apresenta o resultado de uma meta-análise em dados públicos de expressão gênica disponíveis do TEA em estudos associados. A metodologia aplicada consistiu em utilizarmos dados de expressão obtidos após uma revisão da literatura sobre a TEA, Sendo, três conjuntos de dados selecionados, coletados no portal NCBI GEO em Dezembro/19, e analisados via dados RNA-Seq os genes chaves relativos à TEA. O pipeline de análise de RNA-Seq foi utilizado para: (i) extração dos dados em SRA utilizando o fastq-dump, no Rstudio; (ii) avaliação e controle de qualidade via programa Trimmomatic, no qual foi feito o corte de qualidade das sequências; (iii) em seguida, os dados foram alinhados com o genoma de referência (GRCh38) utilizando o Salmon e aplicado a estimativa de quantificação e nível de transcrição; e (iv) o txtimport foi utilizado para a montagem da matriz de contagem, por fim, utilizamos o DESeq para análise de expressão diferencial. A análise da dispersão dos dados de expressão foram exibidos graficamente usando o Vulcano. Em seguida, a técnica PCA (do inglês Principal component analysis) para análise de grupos, junto com a análise de genes enriquecidos, utilizando os termos do GO, identificamos potenciais, grupos e funções dos genes analisados sendo possível identificar um total de dez genes diferencialmente expressos, sendo três genes altamente expressos e sete genes com baixa expressão. Destes genes, oito são codificadores de proteínas, e dois RNAs pequenos. Além disso, foi observado que alguns genes apresentam relação com outra doença genética, no caso a esquizofrenia.
Abstract: Autism Spectrum Disorder (ASD) syndrome is characterized by interaction difficulties, communication deviation and repetitive behaviors. This syndrome is also defined as loss of contact with reality, caused by impossibility or great difficulty in interpersonal communication. ASD can be classified according to severity into: mild, moderate and severe. Early diagnosis of autism is essential for effective treatment. Transcriptomic analyzes are a means of obtaining regulatory information to understand ASD. In this sense, this work presents the result of a meta-analysis on publicly available gene expression data from ASD in associated studies. The methodology applied consisted of using expression data obtained after a review of the literature on ASD, being, three sets of selected data, collected in the NCBI GEO portal in December/19, and analyzed via RNA-Seq data the key genes related to TEA The RNA- Seq analysis pipeline was used to: (i) extract data in SRA using fastq-dump, in Rstudio; (ii) evaluation and quality control via the Trimmomatic program, in which the quality cut of the sequences was performed; (iii) then, the data were aligned with the reference genome (GRCh38) using Salmon and applied to estimate quantification and transcription level; and (iv) txtimport was used to assemble the counting matrix, finally, we used DESeq for differential expression analysis. The scatter analysis of expression data was displayed graphically using Vulcan. Then, the PCA (Principal component analysis) technique for analysis of groups, together with the analysis of enriched genes, using the terms of the GO, we identified potentials, groups and functions of the analyzed genes, being possible to identify a total of ten genes differentially. expressed, being three genes highly expressed and seven genes with low expression. Of these genes, eight are protein-coding, and two are small RNAs. In addition, it was observed that some genes are related to another genetic disease, in this case schizophrenia.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/30201
Aparece nas coleções:CP - Programa de Pós-Graduação em Bioinformática

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
dadospublicosexpressaogenicaautismo.pdf802,9 kBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.