Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/2481
Título: Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica
Título(s) alternativo(s): Method of reduction of data dimensionality derived from the domain of gene expression
Autor(es): Macedo, Dayana Carla de
Orientador(es): Francisco, Antonio Carlos de
Palavras-chave: Genômica
Biologia molecular
Genética - Pesquisa
Diagnóstico de laboratório
Genomics
Molecular biology
Genetics - Research
Diagnosis, Laboratory
Data do documento: 21-Ago-2015
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: MACEDO, Dayana Carla de. Método de redução de dimensionalidade de dados derivados do domínio de expressão gênica. 2015. 143 f. Tese (Doutorado em Engenharia de Produção) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2015.
Resumo: A respectiva pesquisa encontra-se no contexto de um ciclo produtivo de um laboratório de análises clínicas da área genômica. Esse trabalho propôs um método de redução de dimensionalidade que auxilia o diagnóstico para a medicina laboratorial genômica. O novo método de redução de dimensão de dados é chamado de DRM-F e é capaz de identificar em bases deste domínio os atributos (gene) mais relevantes, por meio de conceitos de equivalência e generalização. Foi efetuada a comparação do Método DRM-F com o Método de Seleção de Atributos. Essa comparação objetivou a avaliação do método proposto com o método já existente na mineração de dados, Seleção de Atributos. O Método DRM-F fundamentado em Framework usou conceitos de equivalência e generalização. Esses dois métodos foram aplicados no domínio de expressão de genes usando três bases, denominadas DLBCL, DLBCL Tumor sobre leucemia e ALL/AML contendo dados do linfoma. Analisando os resultados obtidos, utilizando como critérios de avaliação a Validação Cruzada, verificou-se que o uso dos métodos resultou em uma melhora nos valores de taxa de acerto quando comparados com as bases, possuindo todos os atributos no domínio de expressão gênica. Nesse domínio, o melhor método de redução foi com o uso da Abordagem Wrapper nas três bases. Não obstante, ressalta-se que o método proposto apresentou um resultado superior a 80% de taxa de acerto, não podendo ser considerado um método de redução com desempenho ruim. O Método DRM-F, embora tenha apresentado resultados inferiores ao método de Seleção de Atributos, na média geral não apresentou taxa de acerto inferior a 80% na geração de modelos preditivos. O Método DRM-F busca extrair os atributos (gene) comuns e específicos do domínio de estudo, expressão gênica, porém não somente de uma única base, mas, entre todas as bases que pertencem ao domínio. Assim, podem-se obter os atributos (gene) comuns entre as várias doenças analisadas entre as bases. No presente experimento, foi possível extrair os atributos (gene) comuns e específicos entre as doenças analisadas. Com os atributos (gene) comuns e específicos de cada doença, podem-se submeter esses subconjuntos a uma análise biológica, a fim de verificar o significado biológico dos atributos objetivando uma contribuição na área biomédica e direcionamento de diagnósticos.
Abstract: The following research is in the context of a production cycle of a clinical laboratory in the genomic area. This work proposed a dimensionality reduction method that helps the diagnosis for the genomic laboratory medicine. The new method of data size reduction is called DRM-F and it is able to identify on bases of this domain the most relevant (gene) attributes, by means of equivalence and generalization concepts. The DRM-F Method was compared to the Attributes Selection Method. This comparison aimed to assess the proposed method with the existing method for data mining, Attributes Selection. In the DRM-F Method based on Framework used equivalence and generalization concepts. These two methods have been applied in the domain of gene expression using three bases, named DLBCL, DLBCL tumor regarding leukemia and ALL/AML containing lymphoma data. Analyzing the results, using as assessment criteria the Cross Validation, it was found that the use of the methods resulted in an improvement in the hit ratio values as compared with bases having all the attributes in the domain of gene expression. In this area the best reduction method was achieved by using the wrapper approach in the three bases. Nevertheless, it is noteworthy that the proposed method showed a result of over 80% in accuracy rate, which cannot be considered a reduction method with poor performance. Although the DRM-F Method presented results below the attributes selection method, in general it showed no average hit rate lower than 80% in the generation of predictive models. The DRM-F Method, aims to extract common and specific (gene) attributes from the field of study, gene expression, but not only from a single base, but among all the bases belonging to the domain. Thus, one can obtain the (gene) attributes common among the various diseases analyzed between the bases. In the present experiment, it was possible to extract the common and specific (gene) attributes among the analyzed diseases. With the (gene) attributes common and specific to each disease it is possible to submit these subsets to biological analysis in order to verify the biological significance of the attributes with the objective of contributing to the area of biomedical diagnostics and routing.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/2481
Aparece nas coleções:PG - Programa de Pós-Graduação em Engenharia de Produção

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_PPGEP_D_Macedo, Dayana Carla de_2015.pdf
  Disponível a partir de 5000-01-01
1,69 MBAdobe PDFVisualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.