Use este identificador para citar ou linkar para este item:
http://repositorio.utfpr.edu.br/jspui/handle/1/40354Registro completo de metadados
| Campo DC | Valor | Idioma |
|---|---|---|
| dc.creator | Enokida, Alexandre Tolomeotti | - |
| dc.date.accessioned | 2026-05-04T13:13:00Z | - |
| dc.date.available | 2026-05-04T13:13:00Z | - |
| dc.date.issued | 2025-12-04 | - |
| dc.identifier.citation | ENOKIDA, Alexandre Tolomeotti. Estudo experimental da estimativa de cardinalidade para autojunções. 2025. Trabalho de Conclusão de Curso (Bacharelado em Ciência da Computação) – Universidade Tecnológica Federal do Paraná, Campo Mourão, 2025. | pt_BR |
| dc.identifier.uri | http://repositorio.utfpr.edu.br/jspui/handle/1/40354 | - |
| dc.description.abstract | Query optimization is a critical task employed by Database Management Systems (DBMSs) to search for efficient execution plans. Commercial DBMSs employ cost models that rely on estimating the selectivity of predicates and the cardinality of operators, using catalog statistics and data structures such as sketches. However, the assumptions underlying these estimations— such as the inclusion principle in joins or the independence of attributes — often introduce inaccuracies. These inaccuracies leads to the selection of suboptimal plans, severely impacting performance, especially in more complex queries. Recent literature has predominantly focused on estimation for SPJ (Select-Project-Join) and grouping queries, while the effectiveness of estimations for self-join queries remains under-explored. This type of query is widely used in data cleaning tasks, such as denial constraints, but often exhibits unpredictable performance and high memory consumption — frequently due to the adoption of inefficient join algorithms. In this context, the proposal of this work is to experimentally investigate cardinality estimation techniques for self-join queries. To this end, the main contributions the work seeks are: (i) a review of the main cardinality estimation techniques for self-joins; (ii) the implementation of a synthetic data generator, designed for benchmarking estimation techniques applied to self-joins; and (iii) conducting a comprehensive comparative experiment, evaluating the performance of different cardinality estimation strategies for self-join queries. This research is expected to provide results regarding the limitations and effectiveness of current approaches for self-join query cardinality estimation. | pt_BR |
| dc.language | por | pt_BR |
| dc.publisher | Universidade Tecnológica Federal do Paraná | pt_BR |
| dc.rights | openAccess | pt_BR |
| dc.rights.uri | http://creativecommons.org/licenses/by/4.0/ | pt_BR |
| dc.subject | Banco de dados - Gerência | pt_BR |
| dc.subject | Estruturas de dados (Computação) | pt_BR |
| dc.subject | Banco de dados relacionais | pt_BR |
| dc.subject | Data base management | pt_BR |
| dc.subject | Data structures (Computer science) | pt_BR |
| dc.subject | Relational databases | pt_BR |
| dc.title | Estudo experimental da estimativa de cardinalidade para autojunções | pt_BR |
| dc.title.alternative | Cardinality estimation for self-joins: an experimental study | pt_BR |
| dc.type | bachelorThesis | pt_BR |
| dc.description.resumo | O otimizador de consultas é um componente crítico em Sistemas de Gerenciamento de Banco de Dados (SGBDs), pois busca identificar planos de execução eficientes. SGBDs comerciais empregam modelos de custo que dependem da estimativa de seletividade de predicados e da cardinalidade dos operadores, utilizando estatísticas do catálogo e estruturas de dados como sketches. Contudo, as suposições sobre essas estimativas — como o princípio da inclusão em junções ou a independência entre atributos em conjunções de predicados — frequentemente introduzem imprecisões. Essas imprecisões podem levar à escolha de planos subótimos, com impacto severo no desempenho, especialmente em consultas mais complexas. A literatura recente tem se concentrado predominantemente na estimativa para consultas do tipo SPJ (Select-Project-Join) e de agrupamento, enquanto a eficácia das estimativas para consultas de autojunção (self-join) permanece pouco explorada. Esse tipo de consulta é amplamente utilizado em tarefas de limpeza de dados, como a validação de restrições de negação, mas frequentemente apresenta desempenho imprevisível e alto consumo de memória — muitas vezes em decorrência da adoção de algoritmos de junção ineficientes. Neste contexto, a proposta deste trabalho é investigar experimentalmente as técnicas de estimativa de cardinalidade para consultas de self-join. Para tal, as principais contribuições que o trabalho busca são: (i) uma revisão das principais técnicas de estimativa de cardinalidade para self-joins; (ii) a implementação de um gerador de dados sintéticos, especificamente projetado para benchmarking de técnicas de estimativa aplicadas a self-joins; e (iii) a condução de um experimento comparativo abrangente, avaliando o desempenho de diferentes estratégias de estimativa de cardinalidade em consultas de self-join. Espera-se que esta pesquisa forneça resultados sobre os limites e a eficácia das abordagens atuais para a estimativa de cardinalidade para consultas de self-join. | pt_BR |
| dc.degree.local | Campo Mourão | pt_BR |
| dc.publisher.local | Campo Mourao | pt_BR |
| dc.contributor.advisor1 | Pena, Eduardo Henrique Monteiro | - |
| dc.contributor.referee1 | Pena, Eduardo Henrique Monteiro | - |
| dc.contributor.referee2 | Schwerz, André Luís | - |
| dc.contributor.referee3 | Silva, Marco Aurélio Graciotto | - |
| dc.publisher.country | Brasil | pt_BR |
| dc.publisher.department | Departamento Acadêmico de Computação | pt_BR |
| dc.publisher.program | Ciência da Computação | pt_BR |
| dc.publisher.initials | UTFPR | pt_BR |
| dc.subject.cnpq | CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO | pt_BR |
| Aparece nas coleções: | CM - Ciência da Computação | |
Arquivos associados a este item:
| Arquivo | Descrição | Tamanho | Formato | |
|---|---|---|---|---|
| estudoestimativacardinalidadeautojuncoes.pdf | 1,23 MB | Adobe PDF | Visualizar/Abrir |
Este item está licenciada sob uma Licença Creative Commons
