Aprendizagem de máquinas (ML) é um tipo de inteligência artificial (IA) que permite que aplicações de software se tornem mais precisas na previsão de resultados sem serem explicitamente programadas para o fazer. Algoritmos de aprendizagem de máquinas usam dados históricos como entrada para prever novos valores de saída.
Os motores de recomendação são um caso de uso comum para a aprendizagem de máquinas. Outros usos populares incluem detecção de fraude, filtragem de spam, detecção de ameaças de malware, automação de processos de negócios (BPA) e manutenção preditiva.
- Tipos de aprendizagem de máquinas
- Como funciona a aprendizagem supervisionada da máquina
- Como funciona a aprendizagem não supervisionada de máquinas
- Como a aprendizagem semi-supervisionada funciona
- Como funciona a aprendizagem de reforço
- Usos da aprendizagem de máquina
- Vantagens e desvantagens
- Selecionar o modelo certo de aprendizagem de máquina
- Importância da aprendizagem de máquinas interpretáveis por humanos
- O futuro da aprendizagem de máquinas
- História da aprendizagem da máquina
Tipos de aprendizagem de máquinas
A aprendizagem clássica de máquinas é frequentemente categorizada pela forma como um algoritmo aprende a tornar-se mais preciso nas suas previsões. Existem quatro abordagens básicas: aprendizagem supervisionada, aprendizagem não supervisionada, aprendizagem semi-supervisionada e aprendizagem de reforço. O tipo de algoritmo que um cientista de dados escolhe para usar depende do tipo de dados que eles querem prever.
- Aprendizagem supervisionada. Neste tipo de aprendizagem de máquina, os cientistas de dados fornecem algoritmos com dados de treinamento rotulados e definem as variáveis que eles querem que o algoritmo avalie para correlações. Tanto a entrada como a saída do algoritmo é especificada.
- Aprendizagem não supervisionada. Este tipo de aprendizagem de máquina envolve algoritmos que treinam sobre dados não etiquetados. O algoritmo varre através de conjuntos de dados procurando por qualquer conexão significativa. Tanto os algoritmos de dados treinam e as previsões ou recomendações que eles emitem são predeterminadas.
- Aprendizagem Semi-supervisionada. Esta abordagem à aprendizagem da máquina envolve uma mistura dos dois tipos precedentes. Os cientistas de dados podem alimentar um algoritmo rotulado na sua maioria como dados de treinamento, mas o modelo é livre para explorar os dados por si só e desenvolver sua própria compreensão do conjunto de dados.
- Aprendizagem de reforço. A aprendizagem do reforço é tipicamente usada para ensinar uma máquina a completar um processo de múltiplos passos para o qual existem regras claramente definidas. Os cientistas de dados programam um algoritmo para completar uma tarefa e lhe dão pistas positivas ou negativas à medida que se trabalha em como completar uma tarefa. Mas na maioria das vezes, o algoritmo decide por si mesmo que passos tomar ao longo do caminho.
Como funciona a aprendizagem supervisionada da máquina
A aprendizagem supervisionada da máquina requer que o cientista de dados treine o algoritmo tanto com entradas rotuladas como com as saídas desejadas. Os algoritmos de aprendizagem supervisionada são bons para as seguintes tarefas:
- Classificação binária. Dividindo os dados em duas categorias.
- Classificação multi-classe. Escolhendo entre mais de dois tipos de respostas.
- Modelagem de regressão. Previsão de valores contínuos.
- Ensembling. Combinando as previsões de múltiplos modelos de aprendizagem de máquinas para produzir uma previsão precisa.
Como funciona a aprendizagem não supervisionada de máquinas
Algoritmos de aprendizagem não supervisionada de máquinas não requerem que os dados sejam etiquetados. Eles peneiram os dados não rotulados para procurar padrões que podem ser usados para agrupar pontos de dados em subconjuntos. A maioria dos tipos de aprendizagem profunda, incluindo redes neurais, são algoritmos não supervisionados. Algoritmos de aprendizagem não supervisionados são bons para as seguintes tarefas:
- Clustering. Dividindo o conjunto de dados em grupos com base na similaridade.
- Detecção de anomalias. Identificação de pontos de dados não usuais em um conjunto de dados.
- Associação de mineração. Identificação de conjuntos de itens em um conjunto de dados que freqüentemente ocorrem juntos.
- Dimensionality Reduction. Redução do número de variáveis em um conjunto de dados.
Como a aprendizagem semi-supervisionada funciona
A aprendizagem semi-supervisionada funciona por cientistas de dados alimentando uma pequena quantidade de dados de treinamento rotulados para um algoritmo. A partir disto, o algoritmo aprende as dimensões do conjunto de dados, que pode então ser aplicado a dados novos, não rotulados. O desempenho dos algoritmos normalmente melhora quando eles treinam em conjuntos de dados rotulados. Mas a etiquetagem de dados pode ser demorada e cara. A aprendizagem semi-supervisionada atinge um meio-termo entre o desempenho da aprendizagem supervisionada e a eficiência da aprendizagem não supervisionada. Algumas áreas onde a aprendizagem semi-supervisionada é usada incluem:
- tradução automática. Algoritmos de ensino para traduzir uma linguagem baseada em menos de um dicionário completo de palavras.
- Detecção de fraudes. Identificação de casos de fraude quando você tem apenas alguns exemplos positivos.
- Dados de etiquetagem. Algoritmos treinados em pequenos conjuntos de dados podem aprender a aplicar etiquetas de dados em conjuntos maiores automaticamente.
Como funciona a aprendizagem de reforço
A aprendizagem de reforço funciona programando um algoritmo com um objetivo distinto e um conjunto prescrito de regras para atingir esse objetivo. Os cientistas de dados também programam o algoritmo para buscar recompensas positivas — que ele recebe quando executa uma ação que é benéfica para o objetivo final — e evitar punições — que ele recebe quando executa uma ação que o afasta de seu objetivo final. O aprendizado do reforço é frequentemente usado em áreas como:
- Robótica. Robôs podem aprender a executar tarefas no mundo físico usando esta técnica.
- Video gameplay. Reforço de aprendizagem tem sido usado para ensinar bots a jogar vários videojogos.
- Gestão de recursos. Dado recursos finitos e um objetivo definido, a aprendizagem de reforço pode ajudar as empresas a planejar como alocar recursos.