Use este identificador para citar ou linkar para este item: http://repositorio.utfpr.edu.br/jspui/handle/1/15988
Título: Redução de dimensionalidade: aplicação de algoritmos de seleção e extração de atributos
Título(s) alternativo(s): Dimensionality reduction: application of attribute selection and attribute extraction algorithms
Autor(es): De Julio, João Pedro Evaristo
Orientador(es): Borges, Helyane Bronoski
Palavras-chave: Análise de componentes principais
Análise dimensional
Algorítmos computacionais
Principal components analysis
Dimensional analysis
Computer algorithms
Data do documento: 19-Nov-2019
Editor: Universidade Tecnológica Federal do Paraná
Câmpus: Ponta Grossa
Citação: DE JULIO, João Pedro Evaristo. Redução de dimensionalidade: aplicação de algoritmos de seleção e extração de atributos. 2019. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Ponta Grossa, 2019.
Resumo: O diagnóstico de doenças genéticas como câncer tem avançado com a evolução de técnicas de obtenção de dados genéticos, e a quantidade de genes mapeados tem aumentado significativamente e consequentemente a complexidade na análise destes dados devido ao pouco número de amostras. Por meio de técnicas como a Seleção (com as abordagens Filtro, Wrapper e Embedded), e a Extração de atributos é possível realizar a redução da dimensionalidade, que além de remover atributos irrelevantes ou redundantes, torna mais fácil a compreensão dos resultados. A Seleção de atributos tem como objetivo encontrar atributos relevantes para aumentar a capacidade preditiva dos classificadores enquanto a Extração de atributos realiza operações de transformação sem a perda das características dos dados. Este trabalho apresenta uma aplicação de técnicas de Extração de atributos sobre subconjuntos selecionados por meio da Seleção de atributos, realizando assim uma combinação das técnicas. A combinação proposta utiliza a busca sequencial para selecionar os atributos com dois algoritmos da abordagem Filtro e sete formas de redução da abordagem Wrapper. Em cada subconjunto foi-se aplicado a Análise de Componentes Principais (PCA) com os 90, 95 e 99% dos atributos. Para os experimentos, foram utilizadas 5 bases de dados genéticas com milhares de atributos por amostra. Ao realizar a análise da taxa de classificação com sete diferentes classificadores, pode-se notar um aumento significativo na taxa de classificação dos dados após a aplicação da combinação de técnicas, obtendo-se um aumento de até 12% no pior caso.
Abstract: The diagnosis of genetic diseases such as cancer has advanced with the evolution of techniques for obtaining genetic data, and the number of mapped genes has increased significantly and consequently the complexity in the analysis of these data due to the small number of samples. Techniques such as Selection (with the Filter, Wrapper, and Embedded approaches) and Attribute Extraction make it possible to reduce dimensionality, which in addition to removing irrelevant or redundant attributes, makes it easier to understand the results. Attribute Selection aims to find relevant attributes to increase the predictive capacity of classifiers while Attribute Extraction performs transformation operations without losing data’s properties. Thus, this paper presents an application of Attribute Extraction techniques on selected subsets through Attribute Selection. The proposed combination uses sequential search to select attributes with two algorithms of the Filter approach and seven ways to reduce the Wrapper approach. In each subset, PCA was applied with 90, 95 and 99% of the attributes. For the experiments, five genetic databases with thousands of attributes per sample were used. When analyzing the classification rate with seven different classifiers, can be noted a significant increase in the data classification rate after applying the combination of techniques, resulting in an increase of up to 12% in the worst case.
URI: http://repositorio.utfpr.edu.br/jspui/handle/1/15988
Aparece nas coleções:PG - Ciência da Computação

Arquivos associados a este item:
Arquivo Descrição TamanhoFormato 
PG_COCIC_2019_2_15.pdf1,55 MBAdobe PDFThumbnail
Visualizar/Abrir


Os itens no repositório estão protegidos por copyright, com todos os direitos reservados, salvo quando é indicado o contrário.