loader image

Estrutura de dados Árvores em Análise de dados

10-2024

Partindo para as estruturas não lineares, as Árvores/Tree são as primeiras a serem descritas. Sua estrutura e características se portam hierarquicamente, permitindo que cada dado tenha vertentes e bom aprofundamento, além de que é adequado para buscas em grandes escalas de dados. Caracterizando-a, é como se fosse uma árvore física, posto que possui:

  • Nó -> são considerados os valores armazenados e estabelecem hierarquia
  • Raiz -> refere-se ao nó da extremidade superior que não possuem pai, e a árvore se parte dela
  • Arestas -> nada mais do que conexões entre os nós indicando relações
  • Folhas -> nós que não tem filhos, e ficam na extremidade inferior
  • Subárvores -> qualquer nó e seu conjunto de nós filhos, arestas e folhas.

Sabia que existem muitos tipos de árvores, e cada uma atende uma necessidade, servindo para compor sistemas mais complexos, especialmente, bancos de dados, gestão de pastas em sistemas operacionais, criação de algoritmos baseado em busca e ordenação, compressão de dados, organização dos dados. Constituem de:

  • Árvores Binárias -> Cada nó tem no máximo dois filhos, geralmente chamados de filho esquerdo e filho direito.
  • Árvores AVL -> Uma árvore binária de busca balanceada, onde a altura das subárvores esquerda e direita de qualquer nó devem ser 1, 0, -1
  • Árvores B -> Uma árvore balanceada de ordem maior, usada principalmente em sistemas de banco de dados e sistemas de arquivos.
  • Árvores n-árias -> Cada nó pode ter até N filhos. Essas árvores são úteis onde a quantidade de filhos varia.
  • Árvores Red-Black -> Outra árvore binária de busca balanceada que mantém balanceamento através de regras de coloração de nós.
  • Árvores QuadTree -> árvore onde cada nó interno tem exatamente quatro filhos, servindo para particionar um espaço bidimensional, subdividindo-o recursivamente em quatro regiões menores.

Em análise de dados, os algoritmos seriam orientados à arvore para árvores de decisão para ML (Machine Learning) em criar modelos de classificação e regressão usando dados não estruturados de produtos para análise de sentimento, por exemplo.

Para mais detalhes, acesse o ícone a seguir
Rolar para cima