Regressão
É possível prever o valor contínuo de um modelo através do modelo de regressão. Por exemplo, é possível prever os preços dos imóveis em função do tamanho, localização e características da casa. Este é o exemplo mais simples de compreensão da regressão. A regressão é uma técnica supervisionada.
Regressão Lasso
Esta técnica é um tipo de regressão linear e ajuda a diminuir a limitação do modelo. Os valores dos dados encolhem para o centro ou média para evitar o sobre-ajustamento dos dados. Regressão Lasso pode eliminar as variáveis inúteis da equação. Este tipo de regressão é melhor do que a regressão de Ridge e ajuda a reduzir as Variâncias num modelo de aprendizagem da máquina que contém muitas Variâncias.
KNN – K-Nearest Neighbor
Em estatística, o algoritmo de vizinhos k-mais próximos é um método de classificação não paramétrico desenvolvido pela primeira vez por Evelyn Fix e Joseph Hodges em 1951, e posteriormente expandido por Thomas Cover. É usado para classificação e regressão.
Links
https://minerandodados.com.br/machine-learning-na-pratica-knn-python/
https://portaldatascience.com/o-algoritmo-k-nearest-neighbors-knn-em-machine-learning/
Redes Bayesianas / Bayes Theorem / Bayesian Methods
O algoritmo “Naive Bayes” é um classificador probabilístico muito utilizado em machine learning. Baseado no “Teorema de Bayes”, o modelo foi criado por um matemático inglês, e também ministro presibiteriano, chamado Thomas Bayes (1701 – 1761) para tentar provar a existência de Deus.
Random Forest
Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.
K-Means
K-Means é um algoritmo de clusterização (ou agrupamento) disponível na biblioteca Scikit-Learn.
É um algoritmo de aprendizado não supervisionado (ou seja, que não precisa de inputs de confirmação externos) que avalia e clusteriza os dados de acordo com suas características.
PCA – Principal Component Analysis
O PCA é uma técnica estabelecida de aprendizado de máquina. É frequentemente usado na análise de dados exploratória porque revela a estrutura interna dos dados e explica a variação nos dados.
Boosting
No aprendizado de máquina, Boosting é um meta-algoritmo de conjunto para reduzir principalmente o viés e também a variação no aprendizado supervisionado. Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.
Redes Neurais
Redes neurais são sistemas de computação com nós interconectados que funcionam como os neurônios do cérebro humano. Usando algoritmos, elas podem reconhecer padrões escondidos e correlações em dados brutos, agrupá-los e classificá-los, e – com o tempo – aprender e melhorar continuamente.
Hill Climbing
- Segue apenas um sentido, explorando a “vizinhança”
- Não garante obter o Global Optima
- Existem muitas variações, principalmente incluindo elementos não determinísticos no algoritmo
Breadth First Search
Capaz de retornar de uma vizinhança em busca de uma solução melhor (backtracing)
Depth-first search
Explora uma “vizinhança”, retornando e tentando outras ramificações
Best First Search
Usa heurística para avaliar o valor de cada nó
Sua performance depende da heurística