Estrutura de dados Árvores em Análise de dados

Ryan Felipe

Estrutura de dados Árvores em Análise de dados

10-2024

Partindo para as estruturas não lineares, as Árvores/Tree são as primeiras a serem descritas. Sua estrutura e características se portam hierarquicamente, permitindo que cada dado tenha vertentes e bom aprofundamento, além de que é adequado para buscas em grandes escalas de dados. Caracterizando-a, é como se fosse uma árvore física, posto que possui:

Nó -> são considerados os valores armazenados e estabelecem hierarquia
Raiz -> refere-se ao nó da extremidade superior que não possuem pai, e a árvore se parte dela
Arestas -> nada mais do que conexões entre os nós indicando relações
Folhas -> nós que não tem filhos, e ficam na extremidade inferior
Subárvores -> qualquer nó e seu conjunto de nós filhos, arestas e folhas.

Sabia que existem muitos tipos de árvores, e cada uma atende uma necessidade, servindo para compor sistemas mais complexos, especialmente, bancos de dados, gestão de pastas em sistemas operacionais, criação de algoritmos baseado em busca e ordenação, compressão de dados, organização dos dados. Constituem de:

Árvores Binárias -> Cada nó tem no máximo dois filhos, geralmente chamados de filho esquerdo e filho direito.
Árvores AVL -> Uma árvore binária de busca balanceada, onde a altura das subárvores esquerda e direita de qualquer nó devem ser 1, 0, -1
Árvores B -> Uma árvore balanceada de ordem maior, usada principalmente em sistemas de banco de dados e sistemas de arquivos.
Árvores n-árias -> Cada nó pode ter até N filhos. Essas árvores são úteis onde a quantidade de filhos varia.
Árvores Red-Black -> Outra árvore binária de busca balanceada que mantém balanceamento através de regras de coloração de nós.
Árvores QuadTree -> árvore onde cada nó interno tem exatamente quatro filhos, servindo para particionar um espaço bidimensional, subdividindo-o recursivamente em quatro regiões menores.

Em análise de dados, os algoritmos seriam orientados à arvore para árvores de decisão para ML (Machine Learning) em criar modelos de classificação e regressão usando dados não estruturados de produtos para análise de sentimento, por exemplo.

Ryan Felipe

Estrutura de dados Árvores em Análise de dados

Para mais detalhes, acesse o ícone a seguir