A seguir estão algumas tarefas de aprendizado de máquina padrão que foram amplamente estudadas:
- Classification: trata-se do problema de atribuir uma categoria a cada item. Por exemplo, a classificação de documentos consiste em atribuir uma categoria, como política, negócios, esportes ou clima a cada documento, enquanto a classificação de imagens consiste em atribuir a cada imagem uma categoria, como carro, trem ou avião. O número de categorias nessas tarefas costuma ser menor do que algumas centenas, mas pode ser muito maior em algumas tarefas difíceis e até mesmo ilimitado, como em OCR, classificação de texto ou reconhecimento de fala.
- Regression: é o problema de prever um valor real para cada item. Exemplos de regressão incluem previsão de valores de estoque ou de variações de variáveis econômicas. Na regressão, a penalidade para uma previsão incorreta depende da magnitude da diferença entre os valores verdadeiros e previstos, em contraste com o problema de classificação, onde normalmente não há noção de proximidade entre as várias categorias.
- Ranking: é o problema de aprender a ordenar os itens de acordo com algum critério. A pesquisa na web, por exemplo, retornar páginas da web relevantes para uma consulta de pesquisa, é o exemplo de classificação canônica. Muitos outros problemas de classificação semelhantes surgem no contexto do projeto de extração de informações ou sistemas de processamento de linguagem natural.
- Clustering: este é o problema de particionar um conjunto de itens em subconjuntos homogêneos. O clustering é freqüentemente usado para analisar conjuntos de dados muito grandes. Por exemplo, no contexto da análise de rede social, os algoritmos de agrupamento tentam identificar comunidades naturais dentro de grandes grupos de pessoas.
- Redução da dimensionalidade ou aprendizado múltiplo: este problema consiste em transformar uma representação inicial de itens em uma representação de dimensão inferior preservando algumas propriedades da representação inicial. Um exemplo comum envolve o pré-processamento de imagens digitais em tarefas de visão computacional.
Os principais objetivos práticos do aprendizado de máquina consistem em gerar previsões precisas para itens invisíveis e projetar algoritmos eficientes e robustos para produzir essas previsões, mesmo para problemas de grande escala.
Para isso, surgem várias questões algorítmicas e teóricas. Algumas questões fundamentais incluem:
- Que famílias de conceitos podem realmente ser aprendidas e em que condições?
- Quão bem esses conceitos podem ser aprendidos computacionalmente?