Învățarea mecanică (ML) este un tip de inteligență artificială (AI) care permite aplicațiilor software să devină mai precise în prezicerea rezultatelor fără a fi programate în mod explicit pentru a face acest lucru. Algoritmii de învățare automată utilizează date istorice ca intrare pentru a prezice noi valori de ieșire.
Motorii de recomandare sunt un caz de utilizare comună pentru învățarea automată. Alte utilizări populare includ detectarea fraudei, filtrarea spam-ului, detectarea amenințărilor malware, automatizarea proceselor de afaceri (BPA) și întreținerea predictivă.
- Tipuri de învățare automată
- Cum funcționează învățarea mecanică supravegheată
- Cum funcționează învățarea automată nesupravegheată
- Cum funcționează învățarea semi-supervizată
- Cum funcționează învățarea prin întărire
- Utilizări ale învățării automate
- Avantaje și dezavantaje
- Alegerea modelului corect de învățare automată
- Importanța învățării automate interpretabile de către om
- Viitorul învățării automate
- Istoria învățării automate
Tipuri de învățare automată
Învățarea automată clasică este adesea clasificată în funcție de modul în care un algoritm învață să devină mai precis în predicțiile sale. Există patru abordări de bază: învățarea supravegheată, învățarea nesupravegheată, învățarea semisupravegheată și învățarea prin întărire. Tipul de algoritm pe care un cercetător de date alege să îl folosească depinde de tipul de date pe care dorește să le prezică.
- Învățare supravegheată. În acest tip de învățare automată, cercetătorii de date furnizează algoritmilor date de instruire etichetate și definesc variabilele pe care doresc ca algoritmul să le evalueze pentru corelații. Se specifică atât intrarea, cât și ieșirea algoritmului.
- Învățare nesupravegheată. Acest tip de învățare automată implică algoritmi care se antrenează pe date neetichetate. Algoritmul scanează prin seturile de date în căutarea oricărei conexiuni semnificative. Atât datele pe care se antrenează algoritmii, cât și predicțiile sau recomandările pe care le emit sunt predeterminate.
- Învățare semi-supervizată. Această abordare a învățării automate implică un amestec al celor două tipuri precedente. Cercetătorii de date pot alimenta un algoritm cu date de instruire în cea mai mare parte etichetate, dar modelul este liber să exploreze datele pe cont propriu și să-și dezvolte propria înțelegere a setului de date.
- Învățarea prin întărire. Învățarea prin întărire este utilizată de obicei pentru a învăța o mașină să finalizeze un proces în mai multe etape pentru care există reguli clar definite. Oamenii de știință din domeniul datelor programează un algoritm pentru a îndeplini o sarcină și îi dau indicii pozitive sau negative pe măsură ce acesta își dă seama cum să îndeplinească o sarcină. Dar, în cea mai mare parte, algoritmul decide singur ce pași să facă pe parcurs.
Cum funcționează învățarea mecanică supravegheată
Învățarea mecanică supravegheată necesită ca cercetătorul de date să antreneze algoritmul atât cu intrări etichetate, cât și cu ieșiri dorite. Algoritmii de învățare supravegheată sunt buni pentru următoarele sarcini:
- Clasificare binară. Împărțirea datelor în două categorii.
- Clasificare multiclasă. Alegerea între mai mult de două tipuri de răspunsuri.
- Modelarea regresiei. Predicția valorilor continue.
- Ensamblarea. Combinarea predicțiilor mai multor modele de învățare automată pentru a produce o predicție precisă.
Cum funcționează învățarea automată nesupravegheată
Algoritmii de învățare automată nesupravegheată nu au nevoie ca datele să fie etichetate. Aceștia cern prin datele neetichetate pentru a căuta modele care pot fi folosite pentru a grupa punctele de date în subseturi. Majoritatea tipurilor de învățare profundă, inclusiv rețelele neuronale, sunt algoritmi nesupravegheați. Algoritmii de învățare nesupravegheată sunt buni pentru următoarele sarcini:
- Clusterizare. Împărțirea setului de date în grupuri pe baza similitudinii.
- Detectarea anomaliilor. Identificarea punctelor de date neobișnuite într-un set de date.
- Extragerea asociațiilor. Identificarea seturilor de elemente dintr-un set de date care apar frecvent împreună.
- Reducerea dimensionalității. Reducerea numărului de variabile dintr-un set de date.
Cum funcționează învățarea semi-supervizată
Învățarea semi-supervizată funcționează prin alimentarea unui algoritm de către cercetătorii de date cu o cantitate mică de date de instruire etichetate. Din acestea, algoritmul învață dimensiunile setului de date, pe care le poate aplica apoi la date noi, neetichetate. Performanța algoritmilor se îmbunătățește, de obicei, atunci când aceștia se antrenează pe seturi de date etichetate. Dar etichetarea datelor poate consuma mult timp și poate fi costisitoare. Învățarea semisupravegheată reprezintă o cale de mijloc între performanța învățării supravegheate și eficiența învățării nesupravegheate. Unele domenii în care se utilizează învățarea semisupravegheată includ:
- Traducerea automată. Învățarea algoritmilor pentru a traduce un limbaj pe baza unui număr mai mic de cuvinte decât un dicționar complet de cuvinte.
- Detectarea fraudelor. Identificarea cazurilor de fraudă atunci când aveți doar câteva exemple pozitive.
- Etichetarea datelor. Algoritmii antrenați pe seturi mici de date pot învăța să aplice automat etichete de date la seturi mai mari.
Cum funcționează învățarea prin întărire
Învățarea prin întărire funcționează prin programarea unui algoritm cu un obiectiv distinct și un set de reguli prescrise pentru realizarea acestui obiectiv. De asemenea, cercetătorii de date programează algoritmul să caute recompense pozitive – pe care le primește atunci când efectuează o acțiune benefică pentru atingerea scopului final – și să evite pedepsele – pe care le primește atunci când efectuează o acțiune care îl îndepărtează de scopul final. Învățarea prin întărire este adesea utilizată în domenii precum:
- Robotică. Roboții pot învăța să îndeplinească sarcini în lumea fizică folosind această tehnică.
- Joc video. Învățarea prin întărire a fost utilizată pentru a învăța roboții să joace o serie de jocuri video.
- Gestionarea resurselor. Având în vedere resursele finite și un obiectiv definit, învățarea prin întărire poate ajuta întreprinderile să planifice modul de alocare a resurselor.