Machine Learning – Algoritmos

Regressão

É possível prever o valor contínuo de um modelo através do modelo de regressão. Por exemplo, é possível prever os preços dos imóveis em função do tamanho, localização e características da casa. Este é o exemplo mais simples de compreensão da regressão. A regressão é uma técnica supervisionada.

Regressão Lasso

Esta técnica é um tipo de regressão linear e ajuda a diminuir a limitação do modelo. Os valores dos dados encolhem para o centro ou média para evitar o sobre-ajustamento dos dados. Regressão Lasso pode eliminar as variáveis inúteis da equação. Este tipo de regressão é melhor do que a regressão de Ridge e ajuda a reduzir as Variâncias num modelo de aprendizagem da máquina que contém muitas Variâncias.

KNN – K-Nearest Neighbor

Em estatística, o algoritmo de vizinhos k-mais próximos é um método de classificação não paramétrico desenvolvido pela primeira vez por Evelyn Fix e Joseph Hodges em 1951, e posteriormente expandido por Thomas Cover. É usado para classificação e regressão.

Links

https://minerandodados.com.br/machine-learning-na-pratica-knn-python/

https://portaldatascience.com/o-algoritmo-k-nearest-neighbors-knn-em-machine-learning/

Redes Bayesianas / Bayes Theorem / Bayesian Methods

O algoritmo “Naive Bayes” é um classificador probabilístico muito utilizado em machine learning. Baseado no “Teorema de Bayes”, o modelo foi criado por um matemático inglês, e também ministro presibiteriano, chamado Thomas Bayes (1701 – 1761) para tentar provar a existência de Deus.

Random Forest

Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.

K-Means

K-Means é um algoritmo de clusterização (ou agrupamento) disponível na biblioteca Scikit-Learn.

É um algoritmo de aprendizado não supervisionado (ou seja, que não precisa de inputs de confirmação externos) que avalia e clusteriza os dados de acordo com suas características.

PCA – Principal Component Analysis

O PCA é uma técnica estabelecida de aprendizado de máquina. É frequentemente usado na análise de dados exploratória porque revela a estrutura interna dos dados e explica a variação nos dados.

Boosting

No aprendizado de máquina, Boosting é um meta-algoritmo de conjunto para reduzir principalmente o viés e também a variação no aprendizado supervisionado. Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.

Redes Neurais

Redes neurais são sistemas de computação com nós interconectados que funcionam como os neurônios do cérebro humano. Usando algoritmos, elas podem reconhecer padrões escondidos e correlações em dados brutos, agrupá-los e classificá-los, e – com o tempo – aprender e melhorar continuamente.

Hill Climbing

  • Segue apenas um sentido, explorando a “vizinhança”
  • Não garante obter o Global Optima
  • Existem muitas variações, principalmente incluindo elementos não determinísticos no algoritmo

Breadth First Search

Capaz de retornar de uma vizinhança em busca de uma solução melhor (backtracing)

Depth-first search

Explora uma “vizinhança”, retornando e tentando outras ramificações

Best First Search

Usa heurística para avaliar o valor de cada nó

Sua performance depende da heurística

Leave a Reply