Popular Tools


Popular Tools

JavaScript

GitHub

Python

Git

Node.js

jQuery

Docker

React

Visual Studio Code

HTML5

PHP

Java

Slack

MySQL

Google Analytics

NGINX

Gmail

npm

MongoDB

PostgreSQL

Postman

WordPress

Google Drive

TypeScript

Ubuntu

ES6

Stack Overflow

CloudFlare

Jenkins

AngularJS

GitLab

Jira

Redis

Apache HTTP Server

Google Fonts

Kubernetes

Amazon S3

Vue.js

Amazon EC2

C#

CSS 3

Trello

Google Tag Manager

Font Awesome

Visual Studio

Bitbucket

IntelliJ IDEA

Sass

Firebase

Google Maps

Webpack

Django

Sublime Text

Elasticsearch

jQuery UI

React Native

G Suite

Ruby

VirtualBox

GraphQL

Redux

ExpressJS

Laravel

Heroku

Vim

Android SDK

Dropbox

PyCharm

Android Studio

Spring Boot

Confluence

Kafka

AWS Lambda

Microsoft Azure

Mailchimp

RabbitMQ

ASP.NET

Rails

Kibana

Flask

Amazon CloudFront

Markdown

Docker Compose

Modernizr

Notepad++

New Relic

Ansible

Atom

DigitalOcean

Xcode

ESLint

GitHub Pages

PayPal

Skype

Google Cloud Platform

Swift

Yarn

Babel

Microsoft SQL Server

Google AdSense

Stripe

SQLite

Apache Tomcat

Amazon RDS

MariaDB

Terraform

Grafana

Selenium

gulp

PhpStorm

Microsoft IIS

Debian

Amazon Route 53

Sentry

Gradle

WebStorm

Amazon EC2 Container Service

CentOS

Travis CI

Socket.IO

Flutter

Google Compute Engine

Kotlin

Vagrant

Material Design for Angular

CircleCI

AWS Elastic Load Balancing (ELB)

Logstash

Electron

Amazon CloudWatch

SourceTree

Ionic

Twilio

OpenSSL

Scala

Objective-C

Google App Engine

Varnish

Twilio SendGrid

Asana

Shopify

InVision

HubSpot

Drupal

Amazon SES

Datadog

WooCommerce

Grunt

Animate.css

Symfony

Memcached

Zendesk

Bower

Mailgun

RequireJS

Backbone.js

Slick

Handlebars.js

Intercom

Machine Learning – Tarefas

A seguir estão algumas tarefas de aprendizado de máquina padrão que foram amplamente estudadas:

  • Classification: trata-se do problema de atribuir uma categoria a cada item. Por exemplo, a classificação de documentos consiste em atribuir uma categoria, como política, negócios, esportes ou clima a cada documento, enquanto a classificação de imagens consiste em atribuir a cada imagem uma categoria, como carro, trem ou avião. O número de categorias nessas tarefas costuma ser menor do que algumas centenas, mas pode ser muito maior em algumas tarefas difíceis e até mesmo ilimitado, como em OCR, classificação de texto ou reconhecimento de fala.
  • Regression: é o problema de prever um valor real para cada item. Exemplos de regressão incluem previsão de valores de estoque ou de variações de variáveis ​​econômicas. Na regressão, a penalidade para uma previsão incorreta depende da magnitude da diferença entre os valores verdadeiros e previstos, em contraste com o problema de classificação, onde normalmente não há noção de proximidade entre as várias categorias.
  • Ranking: é o problema de aprender a ordenar os itens de acordo com algum critério. A pesquisa na web, por exemplo, retornar páginas da web relevantes para uma consulta de pesquisa, é o exemplo de classificação canônica. Muitos outros problemas de classificação semelhantes surgem no contexto do projeto de extração de informações ou sistemas de processamento de linguagem natural.
  • Clustering: este é o problema de particionar um conjunto de itens em subconjuntos homogêneos. O clustering é freqüentemente usado para analisar conjuntos de dados muito grandes. Por exemplo, no contexto da análise de rede social, os algoritmos de agrupamento tentam identificar comunidades naturais dentro de grandes grupos de pessoas.
  • Redução da dimensionalidade ou aprendizado múltiplo: este problema consiste em transformar uma representação inicial de itens em uma representação de dimensão inferior preservando algumas propriedades da representação inicial. Um exemplo comum envolve o pré-processamento de imagens digitais em tarefas de visão computacional.

Os principais objetivos práticos do aprendizado de máquina consistem em gerar previsões precisas para itens invisíveis e projetar algoritmos eficientes e robustos para produzir essas previsões, mesmo para problemas de grande escala.

Para isso, surgem várias questões algorítmicas e teóricas. Algumas questões fundamentais incluem:

  • Que famílias de conceitos podem realmente ser aprendidas e em que condições?
  • Quão bem esses conceitos podem ser aprendidos computacionalmente?

Machine Learning – Algoritmos

Regressão

É possível prever o valor contínuo de um modelo através do modelo de regressão. Por exemplo, é possível prever os preços dos imóveis em função do tamanho, localização e características da casa. Este é o exemplo mais simples de compreensão da regressão. A regressão é uma técnica supervisionada.

Regressão Lasso

Esta técnica é um tipo de regressão linear e ajuda a diminuir a limitação do modelo. Os valores dos dados encolhem para o centro ou média para evitar o sobre-ajustamento dos dados. Regressão Lasso pode eliminar as variáveis inúteis da equação. Este tipo de regressão é melhor do que a regressão de Ridge e ajuda a reduzir as Variâncias num modelo de aprendizagem da máquina que contém muitas Variâncias.

KNN – K-Nearest Neighbor

Em estatística, o algoritmo de vizinhos k-mais próximos é um método de classificação não paramétrico desenvolvido pela primeira vez por Evelyn Fix e Joseph Hodges em 1951, e posteriormente expandido por Thomas Cover. É usado para classificação e regressão.

Links

https://minerandodados.com.br/machine-learning-na-pratica-knn-python/

https://portaldatascience.com/o-algoritmo-k-nearest-neighbors-knn-em-machine-learning/

Redes Bayesianas / Bayes Theorem / Bayesian Methods

O algoritmo “Naive Bayes” é um classificador probabilístico muito utilizado em machine learning. Baseado no “Teorema de Bayes”, o modelo foi criado por um matemático inglês, e também ministro presibiteriano, chamado Thomas Bayes (1701 – 1761) para tentar provar a existência de Deus.

Random Forest

Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.

K-Means

K-Means é um algoritmo de clusterização (ou agrupamento) disponível na biblioteca Scikit-Learn.

É um algoritmo de aprendizado não supervisionado (ou seja, que não precisa de inputs de confirmação externos) que avalia e clusteriza os dados de acordo com suas características.

PCA – Principal Component Analysis

O PCA é uma técnica estabelecida de aprendizado de máquina. É frequentemente usado na análise de dados exploratória porque revela a estrutura interna dos dados e explica a variação nos dados.

Boosting

No aprendizado de máquina, Boosting é um meta-algoritmo de conjunto para reduzir principalmente o viés e também a variação no aprendizado supervisionado. Baseia-se justamente em um dos algoritmos mais básicos da área de mineração de dados: as árvores de decisão.

Redes Neurais

Redes neurais são sistemas de computação com nós interconectados que funcionam como os neurônios do cérebro humano. Usando algoritmos, elas podem reconhecer padrões escondidos e correlações em dados brutos, agrupá-los e classificá-los, e – com o tempo – aprender e melhorar continuamente.

Hill Climbing

  • Segue apenas um sentido, explorando a “vizinhança”
  • Não garante obter o Global Optima
  • Existem muitas variações, principalmente incluindo elementos não determinísticos no algoritmo

Breadth First Search

Capaz de retornar de uma vizinhança em busca de uma solução melhor (backtracing)

Depth-first search

Explora uma “vizinhança”, retornando e tentando outras ramificações

Best First Search

Usa heurística para avaliar o valor de cada nó

Sua performance depende da heurística