Învățarea mecanică

Învățarea mecanică (ML) este un tip de inteligență artificială (AI) care permite aplicațiilor software să devină mai precise în prezicerea rezultatelor fără a fi programate în mod explicit pentru a face acest lucru. Algoritmii de învățare automată utilizează date istorice ca intrare pentru a prezice noi valori de ieșire.

Motorii de recomandare sunt un caz de utilizare comună pentru învățarea automată. Alte utilizări populare includ detectarea fraudei, filtrarea spam-ului, detectarea amenințărilor malware, automatizarea proceselor de afaceri (BPA) și întreținerea predictivă.

Tipuri de învățare automată

Învățarea automată clasică este adesea clasificată în funcție de modul în care un algoritm învață să devină mai precis în predicțiile sale. Există patru abordări de bază: învățarea supravegheată, învățarea nesupravegheată, învățarea semisupravegheată și învățarea prin întărire. Tipul de algoritm pe care un cercetător de date alege să îl folosească depinde de tipul de date pe care dorește să le prezică.

  • Învățare supravegheată. În acest tip de învățare automată, cercetătorii de date furnizează algoritmilor date de instruire etichetate și definesc variabilele pe care doresc ca algoritmul să le evalueze pentru corelații. Se specifică atât intrarea, cât și ieșirea algoritmului.
  • Învățare nesupravegheată. Acest tip de învățare automată implică algoritmi care se antrenează pe date neetichetate. Algoritmul scanează prin seturile de date în căutarea oricărei conexiuni semnificative. Atât datele pe care se antrenează algoritmii, cât și predicțiile sau recomandările pe care le emit sunt predeterminate.
  • Învățare semi-supervizată. Această abordare a învățării automate implică un amestec al celor două tipuri precedente. Cercetătorii de date pot alimenta un algoritm cu date de instruire în cea mai mare parte etichetate, dar modelul este liber să exploreze datele pe cont propriu și să-și dezvolte propria înțelegere a setului de date.
  • Învățarea prin întărire. Învățarea prin întărire este utilizată de obicei pentru a învăța o mașină să finalizeze un proces în mai multe etape pentru care există reguli clar definite. Oamenii de știință din domeniul datelor programează un algoritm pentru a îndeplini o sarcină și îi dau indicii pozitive sau negative pe măsură ce acesta își dă seama cum să îndeplinească o sarcină. Dar, în cea mai mare parte, algoritmul decide singur ce pași să facă pe parcurs.

Cum funcționează învățarea mecanică supravegheată

Învățarea mecanică supravegheată necesită ca cercetătorul de date să antreneze algoritmul atât cu intrări etichetate, cât și cu ieșiri dorite. Algoritmii de învățare supravegheată sunt buni pentru următoarele sarcini:

  • Clasificare binară. Împărțirea datelor în două categorii.
  • Clasificare multiclasă. Alegerea între mai mult de două tipuri de răspunsuri.
  • Modelarea regresiei. Predicția valorilor continue.
  • Ensamblarea. Combinarea predicțiilor mai multor modele de învățare automată pentru a produce o predicție precisă.

Cum funcționează învățarea automată nesupravegheată

Algoritmii de învățare automată nesupravegheată nu au nevoie ca datele să fie etichetate. Aceștia cern prin datele neetichetate pentru a căuta modele care pot fi folosite pentru a grupa punctele de date în subseturi. Majoritatea tipurilor de învățare profundă, inclusiv rețelele neuronale, sunt algoritmi nesupravegheați. Algoritmii de învățare nesupravegheată sunt buni pentru următoarele sarcini:

  • Clusterizare. Împărțirea setului de date în grupuri pe baza similitudinii.
  • Detectarea anomaliilor. Identificarea punctelor de date neobișnuite într-un set de date.
  • Extragerea asociațiilor. Identificarea seturilor de elemente dintr-un set de date care apar frecvent împreună.
  • Reducerea dimensionalității. Reducerea numărului de variabile dintr-un set de date.

Cum funcționează învățarea semi-supervizată

Învățarea semi-supervizată funcționează prin alimentarea unui algoritm de către cercetătorii de date cu o cantitate mică de date de instruire etichetate. Din acestea, algoritmul învață dimensiunile setului de date, pe care le poate aplica apoi la date noi, neetichetate. Performanța algoritmilor se îmbunătățește, de obicei, atunci când aceștia se antrenează pe seturi de date etichetate. Dar etichetarea datelor poate consuma mult timp și poate fi costisitoare. Învățarea semisupravegheată reprezintă o cale de mijloc între performanța învățării supravegheate și eficiența învățării nesupravegheate. Unele domenii în care se utilizează învățarea semisupravegheată includ:

  • Traducerea automată. Învățarea algoritmilor pentru a traduce un limbaj pe baza unui număr mai mic de cuvinte decât un dicționar complet de cuvinte.
  • Detectarea fraudelor. Identificarea cazurilor de fraudă atunci când aveți doar câteva exemple pozitive.
  • Etichetarea datelor. Algoritmii antrenați pe seturi mici de date pot învăța să aplice automat etichete de date la seturi mai mari.

Cum funcționează învățarea prin întărire

Învățarea prin întărire funcționează prin programarea unui algoritm cu un obiectiv distinct și un set de reguli prescrise pentru realizarea acestui obiectiv. De asemenea, cercetătorii de date programează algoritmul să caute recompense pozitive – pe care le primește atunci când efectuează o acțiune benefică pentru atingerea scopului final – și să evite pedepsele – pe care le primește atunci când efectuează o acțiune care îl îndepărtează de scopul final. Învățarea prin întărire este adesea utilizată în domenii precum:

  • Robotică. Roboții pot învăța să îndeplinească sarcini în lumea fizică folosind această tehnică.
  • Joc video. Învățarea prin întărire a fost utilizată pentru a învăța roboții să joace o serie de jocuri video.
  • Gestionarea resurselor. Având în vedere resursele finite și un obiectiv definit, învățarea prin întărire poate ajuta întreprinderile să planifice modul de alocare a resurselor.
Învățarea automată este ca o statistică pe steroizi.

Utilizări ale învățării automate

Astăzi, învățarea automată este utilizată într-o gamă largă de aplicații. Poate că unul dintre cele mai cunoscute exemple de machine learning în acțiune este motorul de recomandare care alimentează News Feed-ul Facebook.

Facebook folosește machine learning pentru a personaliza modul în care este livrat feed-ul fiecărui membru. Dacă un membru se oprește frecvent să citească postările unui anumit grup, motorul de recomandare va începe să afișeze mai mult din activitatea acelui grup mai devreme în feed.

În spatele scenei, motorul încearcă să consolideze tiparele cunoscute din comportamentul online al membrului. În cazul în care membrul își schimbă tiparele și nu mai citește postările din acel grup în săptămânile următoare, News Feed se va ajusta în consecință.

Pe lângă motoarele de recomandare, alte utilizări ale învățării automate includ următoarele:

Gestionarea relațiilor cu clienții — software-ul CRM poate utiliza modele de învățare automată pentru a analiza e-mailurile și pentru a solicita membrilor echipei de vânzări să răspundă mai întâi la cele mai importante mesaje. Sistemele mai avansate pot chiar să recomande răspunsuri potențial eficiente.

Business intelligence — Furnizorii de BI și analiză folosesc învățarea automată în software-ul lor pentru a identifica puncte de date potențial importante, modele de puncte de date și anomalii.

Sistemele de informare a resurselor umane — Sistemele HRIS pot folosi modele de învățare automată pentru a filtra aplicațiile și a identifica cei mai buni candidați pentru un post vacant.

Mașini care se conduc singure — Algoritmii de învățare automată pot face posibil chiar ca o mașină semiautonomă să recunoască un obiect parțial vizibil și să alerteze șoferul.

Asistenți virtuali — Asistenții inteligenți combină de obicei modelele de învățare automată supravegheate și nesupravegheate pentru a interpreta vorbirea naturală și a furniza context.

Avantaje și dezavantaje

Învățarea automată a cunoscut cazuri de utilizare puternice, de la prezicerea comportamentului clienților constituind sistemul de operare pentru mașinile care se conduc singure. Dar doar pentru că unele industrii au văzut beneficii nu înseamnă că învățarea automată este lipsită de dezavantaje.

Când vine vorba de avantaje, învățarea automată poate ajuta întreprinderile să își înțeleagă clienții la un nivel mai profund. Colectând date despre clienți și corelându-le cu comportamente de-a lungul timpului, algoritmii de învățare automată pot învăța asociații și pot ajuta echipele să adapteze dezvoltarea produselor și inițiativele de marketing la cererea clienților.

Câteva companii de internet folosesc învățarea automată ca motor principal în modelele lor de afaceri. Uber, de exemplu, utilizează algoritmi pentru a potrivi șoferii cu călătorii. Google folosește învățarea automată pentru a scoate la suprafață reclamele potrivite în căutări.

Dar învățarea automată vine cu dezavantaje. În primul rând, poate fi costisitoare. Proiectele de învățare automată sunt de obicei conduse de cercetători de date, care au salarii mari. Aceste proiecte necesită, de asemenea, o infrastructură software care poate fi foarte costisitoare.

Există, de asemenea, problema prejudecății învățării automate. Algoritmii care s-au antrenat pe seturi de date care exclud anumite populații sau conțin erori pot duce la modele inexacte ale lumii care, în cel mai bun caz, eșuează și, în cel mai rău caz, sunt discriminatorii. Atunci când o întreprindere își bazează procesele de bază ale afacerii pe modele părtinitoare, se poate lovi de prejudicii de reglementare și de reputație.

Alegerea modelului corect de învățare automată

Procesul de alegere a modelului corect de învățare automată pentru a rezolva o problemă poate fi consumator de timp dacă nu este abordat în mod strategic.

Pasul 1: Aliniați problema cu potențialele intrări de date care ar trebui să fie luate în considerare pentru soluție. Acest pas necesită ajutor din partea cercetătorilor de date și a experților care au o înțelegere profundă a problemei.

Pasul 2: Colectați datele, formatați-le și etichetați-le dacă este necesar. Această etapă este condusă, de obicei, de oamenii de știință de date, cu ajutorul celor de la data wranglers.

Etapa 3: Alegeți ce algoritm(i) să utilizați și testați pentru a vedea cât de bine funcționează. Această etapă este, de obicei, realizată de cercetătorii de date.

Etapa 4: Continuați să rafinați rezultatele până când acestea ating un nivel acceptabil de acuratețe. Această etapă este de obicei realizată de cercetătorii de date cu feedback de la experți care au o înțelegere profundă a problemei.

Importanța învățării automate interpretabile de către om

Explicarea modului în care funcționează un anumit model ML poate fi o provocare atunci când modelul este complex. Există unele industrii verticale în care cercetătorii de date trebuie să utilizeze modele simple de învățare automată, deoarece este important pentru afacere să explice cum a fost luată fiecare decizie. Acest lucru este valabil mai ales în industriile cu sarcini grele de conformitate, cum ar fi sectorul bancar și cel al asigurărilor.

Modelurile complexe pot face predicții precise, dar explicarea către un profan a modului în care a fost determinat un rezultat poate fi dificilă.

Viitorul învățării automate

În timp ce algoritmii de învățare automată există de zeci de ani, ei au dobândit o nouă popularitate pe măsură ce inteligența artificială (AI) a crescut în importanță. Modelele de învățare profundă, în special, alimentează cele mai avansate aplicații de inteligență artificială din prezent.

Platformele de învățare mecanică se numără printre cele mai competitive domenii ale tehnologiei de întreprindere, majoritatea furnizorilor importanți, inclusiv Amazon, Google, Microsoft, IBM și alții, întrecându-se în a-și înscrie clienții pentru servicii de platformă care acoperă tot spectrul de activități de învățare mecanică, inclusiv colectarea datelor, pregătirea datelor, clasificarea datelor, construirea de modele, instruirea și implementarea aplicațiilor.

Pe măsură ce învățarea automată continuă să crească în importanță pentru operațiunile de afaceri și IA devine din ce în ce mai practică în cadrul întreprinderilor, războiul platformelor de învățare automată nu va face decât să se intensifice.

Învățarea profundă funcționează în moduri foarte diferite de învățarea automată tradițională.

Continuarea cercetării în domeniul învățării profunde și al inteligenței artificiale se concentrează din ce în ce mai mult pe dezvoltarea unor aplicații mai generale. Modelele de inteligență artificială de astăzi necesită o pregătire extinsă pentru a produce un algoritm care este foarte optimizat pentru a îndeplini o singură sarcină. Dar unii cercetători explorează modalități de a face modelele mai flexibile și caută tehnici care să permită unei mașini să aplice contextul învățat de la o sarcină la sarcini viitoare, diferite.

Istoria învățării automate

1642 – Blaise Pascal inventează o mașină mecanică care poate adăuga, scădea, înmulți și împărți.

1679 – Gottfried Wilhelm Leibniz concepe sistemul de cod binar.

1834 – Charles Babbage concepe ideea unui dispozitiv general multifuncțional care ar putea fi programat cu ajutorul unor cartele perforate.

1842 – Ada Lovelace descrie o secvență de operații pentru rezolvarea problemelor matematice folosind mașina teoretică cu cartele perforate a lui Charles Babbage și devine primul programator.

1847 – George Boole creează logica booleană, o formă de algebră în care toate valorile pot fi reduse la valorile binare de adevărat sau fals.

1936 – Logicianul și criptanalistul englez Alan Turing propune o mașină universală care ar putea descifra și executa un set de instrucțiuni. Demonstrația sa publicată este considerată baza informaticii.

1952 – Arthur Samuel creează un program pentru a ajuta un calculator IBM să devină mai bun la jocul de dame cu cât joacă mai mult.

1959 – MADALINE devine prima rețea neuronală artificială aplicată unei probleme din lumea reală: eliminarea ecourilor din liniile telefonice.

1985 – Rețeaua neuronală artificială a lui Terry Sejnowski și Charles Rosenberg a învățat singură cum să pronunțe corect 20.000 de cuvinte într-o săptămână.

1997 – Deep Blue de la IBM l-a învins pe marele maestru de șah Garry Kasparov.

1999 – Un prototip de stație de lucru inteligentă CAD a analizat 22.000 de mamografii și a detectat cancerul cu 52% mai precis decât o făceau radiologii.

2006 – Informaticianul Geoffrey Hinton inventează termenul de învățare profundă pentru a descrie cercetarea în domeniul rețelelor neuronale.

2012 – O rețea neuronală nesupravegheată creată de Google a învățat să recunoască pisici în videoclipurile de pe YouTube cu o acuratețe de 74,8%.

2014 – Un chatbot trece testul Turing, convingând 33% dintre judecătorii umani că este un adolescent ucrainean pe nume Eugene Goostman.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *