Aprendizagem de máquinas

Aprendizagem de máquinas (ML) é um tipo de inteligência artificial (IA) que permite que aplicações de software se tornem mais precisas na previsão de resultados sem serem explicitamente programadas para o fazer. Algoritmos de aprendizagem de máquinas usam dados históricos como entrada para prever novos valores de saída.

Os motores de recomendação são um caso de uso comum para a aprendizagem de máquinas. Outros usos populares incluem detecção de fraude, filtragem de spam, detecção de ameaças de malware, automação de processos de negócios (BPA) e manutenção preditiva.

Tipos de aprendizagem de máquinas

A aprendizagem clássica de máquinas é frequentemente categorizada pela forma como um algoritmo aprende a tornar-se mais preciso nas suas previsões. Existem quatro abordagens básicas: aprendizagem supervisionada, aprendizagem não supervisionada, aprendizagem semi-supervisionada e aprendizagem de reforço. O tipo de algoritmo que um cientista de dados escolhe para usar depende do tipo de dados que eles querem prever.

  • Aprendizagem supervisionada. Neste tipo de aprendizagem de máquina, os cientistas de dados fornecem algoritmos com dados de treinamento rotulados e definem as variáveis que eles querem que o algoritmo avalie para correlações. Tanto a entrada como a saída do algoritmo é especificada.
  • Aprendizagem não supervisionada. Este tipo de aprendizagem de máquina envolve algoritmos que treinam sobre dados não etiquetados. O algoritmo varre através de conjuntos de dados procurando por qualquer conexão significativa. Tanto os algoritmos de dados treinam e as previsões ou recomendações que eles emitem são predeterminadas.
  • Aprendizagem Semi-supervisionada. Esta abordagem à aprendizagem da máquina envolve uma mistura dos dois tipos precedentes. Os cientistas de dados podem alimentar um algoritmo rotulado na sua maioria como dados de treinamento, mas o modelo é livre para explorar os dados por si só e desenvolver sua própria compreensão do conjunto de dados.
  • Aprendizagem de reforço. A aprendizagem do reforço é tipicamente usada para ensinar uma máquina a completar um processo de múltiplos passos para o qual existem regras claramente definidas. Os cientistas de dados programam um algoritmo para completar uma tarefa e lhe dão pistas positivas ou negativas à medida que se trabalha em como completar uma tarefa. Mas na maioria das vezes, o algoritmo decide por si mesmo que passos tomar ao longo do caminho.

Como funciona a aprendizagem supervisionada da máquina

A aprendizagem supervisionada da máquina requer que o cientista de dados treine o algoritmo tanto com entradas rotuladas como com as saídas desejadas. Os algoritmos de aprendizagem supervisionada são bons para as seguintes tarefas:

  • Classificação binária. Dividindo os dados em duas categorias.
  • Classificação multi-classe. Escolhendo entre mais de dois tipos de respostas.
  • Modelagem de regressão. Previsão de valores contínuos.
  • Ensembling. Combinando as previsões de múltiplos modelos de aprendizagem de máquinas para produzir uma previsão precisa.

Como funciona a aprendizagem não supervisionada de máquinas

Algoritmos de aprendizagem não supervisionada de máquinas não requerem que os dados sejam etiquetados. Eles peneiram os dados não rotulados para procurar padrões que podem ser usados para agrupar pontos de dados em subconjuntos. A maioria dos tipos de aprendizagem profunda, incluindo redes neurais, são algoritmos não supervisionados. Algoritmos de aprendizagem não supervisionados são bons para as seguintes tarefas:

  • Clustering. Dividindo o conjunto de dados em grupos com base na similaridade.
  • Detecção de anomalias. Identificação de pontos de dados não usuais em um conjunto de dados.
  • Associação de mineração. Identificação de conjuntos de itens em um conjunto de dados que freqüentemente ocorrem juntos.
  • Dimensionality Reduction. Redução do número de variáveis em um conjunto de dados.

Como a aprendizagem semi-supervisionada funciona

A aprendizagem semi-supervisionada funciona por cientistas de dados alimentando uma pequena quantidade de dados de treinamento rotulados para um algoritmo. A partir disto, o algoritmo aprende as dimensões do conjunto de dados, que pode então ser aplicado a dados novos, não rotulados. O desempenho dos algoritmos normalmente melhora quando eles treinam em conjuntos de dados rotulados. Mas a etiquetagem de dados pode ser demorada e cara. A aprendizagem semi-supervisionada atinge um meio-termo entre o desempenho da aprendizagem supervisionada e a eficiência da aprendizagem não supervisionada. Algumas áreas onde a aprendizagem semi-supervisionada é usada incluem:

  • tradução automática. Algoritmos de ensino para traduzir uma linguagem baseada em menos de um dicionário completo de palavras.
  • Detecção de fraudes. Identificação de casos de fraude quando você tem apenas alguns exemplos positivos.
  • Dados de etiquetagem. Algoritmos treinados em pequenos conjuntos de dados podem aprender a aplicar etiquetas de dados em conjuntos maiores automaticamente.

Como funciona a aprendizagem de reforço

A aprendizagem de reforço funciona programando um algoritmo com um objetivo distinto e um conjunto prescrito de regras para atingir esse objetivo. Os cientistas de dados também programam o algoritmo para buscar recompensas positivas — que ele recebe quando executa uma ação que é benéfica para o objetivo final — e evitar punições — que ele recebe quando executa uma ação que o afasta de seu objetivo final. O aprendizado do reforço é frequentemente usado em áreas como:

  • Robótica. Robôs podem aprender a executar tarefas no mundo físico usando esta técnica.
  • Video gameplay. Reforço de aprendizagem tem sido usado para ensinar bots a jogar vários videojogos.
  • Gestão de recursos. Dado recursos finitos e um objetivo definido, a aprendizagem de reforço pode ajudar as empresas a planejar como alocar recursos.
A aprendizagem de máquinas é como as estatísticas sobre esteróides.

Usos da aprendizagem de máquina

Hoje em dia, a aprendizagem de máquina é usada numa vasta gama de aplicações. Talvez um dos exemplos mais conhecidos de aprendizagem de máquinas em ação é o mecanismo de recomendação que alimenta o News Feed.

Facebook usa a aprendizagem de máquinas para personalizar a forma como o feed de cada membro é entregue. Se um membro frequentemente pára para ler as mensagens de um grupo em particular, o mecanismo de recomendação começará a mostrar mais atividades desse grupo mais cedo no feed.

Nos bastidores, o mecanismo está tentando reforçar padrões conhecidos no comportamento online do membro. Caso o membro mude os padrões e não leia as mensagens desse grupo nas próximas semanas, o News Feed se ajustará de acordo.

Além dos mecanismos de recomendação, outros usos para a aprendizagem de máquinas incluem o seguinte:

Gestão de relacionamento com o cliente — O software de CRM pode usar modelos de aprendizagem de máquinas para analisar e-mails e solicitar aos membros da equipe de vendas que respondam primeiro às mensagens mais importantes. Sistemas mais avançados podem até recomendar respostas potencialmente eficazes.

Business intelligence — Os fornecedores de BI e de análises usam o aprendizado de máquinas em seus softwares para identificar pontos de dados potencialmente importantes, padrões de pontos de dados e anomalias.

Sistemas de informação de recursos humanos — Os sistemas HRIS podem usar modelos de aprendizado de máquinas para filtrar através de aplicativos e identificar os melhores candidatos para uma posição aberta.

Carros auto-condução — Algoritmos de aprendizagem de máquinas podem até tornar possível para um carro semi-autônomo reconhecer um objeto parcialmente visível e alertar o motorista.

Assistentes virtuais — Assistentes inteligentes tipicamente combinam modelos de aprendizagem de máquinas supervisionados e não supervisionados para interpretar a fala natural e o contexto de fornecimento.

Vantagens e desvantagens

Aprendizagem de máquinas tem visto casos de uso poderoso que vão desde a previsão do comportamento do cliente que constitui o sistema operacional para carros auto-conduzidos. Mas só porque algumas indústrias têm visto benefícios, não significa que a aprendizagem de máquinas esteja sem os seus inconvenientes.

Quando se trata de vantagens, a aprendizagem de máquinas pode ajudar as empresas a compreender os seus clientes a um nível mais profundo. Ao recolher dados dos clientes e correlacioná-los com comportamentos ao longo do tempo, os algoritmos de aprendizagem de máquinas podem aprender associações e ajudar as equipas a adaptar o desenvolvimento de produtos e iniciativas de marketing à procura dos clientes.

algumas empresas da Internet utilizam a aprendizagem de máquinas como condutor principal nos seus modelos de negócio. Uber, por exemplo, usa algoritmos para combinar pilotos com pilotos. O Google utiliza a aprendizagem de máquinas para colocar os anúncios certos na superfície nas pesquisas.

Mas a aprendizagem de máquinas vem com desvantagens. Primeiro e acima de tudo, pode ser caro. Os projectos de aprendizagem de máquinas são normalmente conduzidos por cientistas de dados, que comandam salários elevados. Esses projetos também requerem infra-estrutura de software que pode ser de alto custo.

Existe também o problema do viés da aprendizagem de máquinas. Algoritmos treinados em conjuntos de dados que excluem determinadas populações ou contêm erros podem levar a modelos imprecisos do mundo que, na melhor das hipóteses, falham e, na pior, são discriminatórios. Quando uma empresa baseia seus processos centrais de negócios em modelos tendenciosos, ela pode se deparar com danos regulamentares e de reputação.

Selecionar o modelo certo de aprendizagem de máquina

O processo de escolher o modelo certo de aprendizagem de máquina para resolver um problema pode ser demorado se não for abordado estrategicamente.

P>Passo 1: Alinhar o problema com potenciais entradas de dados que devem ser consideradas para a solução. Este passo requer ajuda de cientistas de dados e especialistas que tenham um profundo entendimento do problema.

P>Passo 2: Colete os dados, formate-os e etiquete os dados, se necessário. Este passo é normalmente conduzido por cientistas de dados, com a ajuda de data wranglers.

P>Passo 3: Escolha qual(is) algoritmo(s) usar e teste(s) para ver o bom desempenho deles. Este passo é normalmente realizado pelos data scientists.

P>Passo 4: Continue a afinar as saídas até que elas atinjam um nível aceitável de precisão. Este passo é geralmente realizado por cientistas de dados com feedback de especialistas que têm uma profunda compreensão do problema.

Importância da aprendizagem de máquinas interpretáveis por humanos

Explicar como um modelo ML específico funciona pode ser um desafio quando o modelo é complexo. Há algumas indústrias verticais onde os cientistas de dados têm que usar modelos simples de aprendizagem de máquinas porque é importante para o negócio explicar como cada uma e todas as decisões foram tomadas. Isso é especialmente verdade em indústrias com pesados encargos de conformidade como bancos e seguros.

Modelos complexos podem fazer previsões precisas, mas explicar a um leigo como um resultado foi determinado pode ser difícil.

O futuro da aprendizagem de máquinas

Embora os algoritmos de aprendizagem de máquinas já existam há décadas, eles atingiram uma nova popularidade à medida que a inteligência artificial (IA) cresceu em proeminência. Os modelos de aprendizagem profunda, em particular, potencializam as aplicações de IA mais avançadas de hoje.

As plataformas de aprendizagem de máquinas estão entre os reinos mais competitivos da tecnologia empresarial, com a maioria dos principais fornecedores, incluindo Amazon, Google, Microsoft, IBM e outros, correndo para inscrever clientes para serviços de plataforma que cobrem o espectro de atividades de aprendizagem de máquinas, incluindo coleta de dados, preparação de dados, classificação de dados, construção de modelos, treinamento e implantação de aplicativos.

As máquinas de aprendizagem continuam a ter uma importância cada vez maior nas operações empresariais e a IA torna-se cada vez mais prática em ambientes empresariais, as guerras de plataformas de aprendizagem de máquinas irão apenas intensificar-se.

A aprendizagem profunda funciona de formas muito diferentes da aprendizagem tradicional de máquinas.

P>Pesquisa contínua sobre aprendizagem profunda e IA está cada vez mais focada no desenvolvimento de aplicações mais gerais. Os modelos atuais de IA requerem treinamento extensivo para produzir um algoritmo que seja altamente otimizado para realizar uma tarefa. Mas alguns pesquisadores estão explorando maneiras de tornar os modelos mais flexíveis e estão procurando técnicas que permitam a uma máquina aplicar o contexto aprendido de uma tarefa a tarefas futuras, tarefas diferentes.

História da aprendizagem da máquina

1642 – Blaise Pascal inventa uma máquina mecânica que pode adicionar, subtrair, multiplicar e dividir.

1679 – Gottfried Wilhelm Leibniz inventa o sistema de código binário.

1834 – Charles Babbage concebe a ideia de um dispositivo de uso geral que poderia ser programado com cartões perfurados.

1842 – Ada Lovelace descreve uma sequência de operações para resolver problemas matemáticos usando a máquina teórica de cartões perfurados de Charles Babbage e torna-se o primeiro programador.

1847 – George Boole cria a lógica Booleana, uma forma de álgebra na qual todos os valores podem ser reduzidos aos valores binários de verdadeiro ou falso.

1936 – O lógico e criptanalista inglês Alan Turing propõe uma máquina universal que poderia decifrar e executar um conjunto de instruções. Sua prova publicada é considerada a base da informática.

1952 – Arthur Samuel cria um programa para ajudar um computador IBM a melhorar em damas quanto mais ele toca.

1959 – MADALINE torna-se a primeira rede neural artificial aplicada a um problema do mundo real: remover ecos de linhas telefônicas.

1985 – A rede neural artificial de Terry Sejnowski e Charles Rosenberg ensinou-se a pronunciar corretamente 20.000 palavras em uma semana.

1997 – O mestre de xadrez de batida Deep Blue da IBM, Garry Kasparov.

1999 – Uma estação de trabalho inteligente protótipo CAD revisou 22.000 mamografias e detectou câncer 52% mais precisamente do que os radiologistas.

2006 – O cientista informático Geoffrey Hinton inventa o termo deep learning para descrever a pesquisa da rede neural.

2012 – Uma rede neural não supervisionada criada pelo Google aprendeu a reconhecer gatos em vídeos do YouTube com 74,8% de precisão.

2014 – Um chatbot passa no Teste de Turing convencendo 33% dos juízes humanos de que era um adolescente ucraniano chamado Eugene Goostman.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *