Gépi tanulás

A gépi tanulás (ML) a mesterséges intelligencia (AI) egy fajtája, amely lehetővé teszi a szoftveralkalmazások számára, hogy pontosabbá tegyék az eredmények előrejelzését anélkül, hogy kifejezetten erre programoznák őket. A gépi tanulási algoritmusok múltbeli adatokat használnak bemenetként az új kimeneti értékek előrejelzéséhez.

A gépi tanulás gyakori felhasználási területe az ajánlómotorok. További népszerű felhasználási területek közé tartozik a csalásfelismerés, a spamszűrés, a rosszindulatú fenyegetések felismerése, az üzleti folyamatok automatizálása (BPA) és a prediktív karbantartás.

A gépi tanulás típusai

A klasszikus gépi tanulást gyakran aszerint kategorizálják, hogy az algoritmus hogyan tanulja meg, hogy pontosabbá tegye előrejelzéseit. Négy alapvető megközelítés létezik: felügyelt tanulás, felügyelet nélküli tanulás, félig felügyelt tanulás és megerősítéses tanulás. Az, hogy az adattudós milyen típusú algoritmust választ, attól függ, hogy milyen típusú adatokat szeretne megjósolni.

  • Felügyelt tanulás. A gépi tanulás ezen típusában az adattudósok címkézett képzési adatokkal látják el az algoritmusokat, és meghatározzák azokat a változókat, amelyeket az algoritmusnak korrelációk szempontjából értékelni kell. Az algoritmus bemenete és kimenete is meghatározott.
  • Felügyelet nélküli tanulás. A gépi tanulás ezen típusa olyan algoritmusokat foglal magában, amelyek címkézetlen adatokon edzenek. Az algoritmus végigpásztázza az adathalmazokat, értelmes kapcsolatokat keresve. Mind az adatok, amelyeken az algoritmusok edzenek, mind a kimeneti előrejelzések vagy ajánlások előre meghatározottak.
  • Félig felügyelt tanulás. A gépi tanulás ezen megközelítése a két előző típus keverékét foglalja magában. Az adattudósok többnyire címkézett gyakorlóadatokkal táplálhatnak egy algoritmust, de a modell szabadon felfedezheti az adatokat saját maga, és kialakíthatja saját megértését az adathalmazról.
  • Erősítéses tanulás. A megerősítéses tanulást jellemzően arra használják, hogy egy gépet megtanítsanak egy többlépcsős folyamat elvégzésére, amelyre egyértelműen meghatározott szabályok vonatkoznak. Az adattudósok egy algoritmust programoznak be egy feladat elvégzésére, és pozitív vagy negatív jelzéseket adnak neki, miközben kitalálja, hogyan végezze el a feladatot. De a legtöbbször az algoritmus magától eldönti, hogy milyen lépéseket tegyen az út során.

Hogyan működik a felügyelt gépi tanulás

A felügyelt gépi tanulás megköveteli, hogy az adattudós az algoritmust megjelölt bemenetekkel és kívánt kimenetekkel is betanítsa. A felügyelt tanulási algoritmusok a következő feladatokra alkalmasak:

  • Bináris osztályozás. Az adatok két kategóriára osztása.
  • Többosztályos osztályozás. Több mint kétféle válasz közül választani.
  • Regressziós modellezés. Folyamatos értékek előrejelzése.
  • Ensembling. Több gépi tanulási modell előrejelzéseinek kombinálása egy pontos előrejelzés előállításához.

Hogyan működik a felügyelet nélküli gépi tanulás

A felügyelet nélküli gépi tanulási algoritmusok nem igénylik az adatok címkézését. Átvizsgálják a címkézetlen adatokat, hogy olyan mintákat keressenek, amelyek segítségével az adatpontokat részhalmazokba lehet csoportosítani. A mélytanulás legtöbb típusa, beleértve a neurális hálózatokat is, felügyelet nélküli algoritmus. A felügyelet nélküli tanulási algoritmusok a következő feladatokra alkalmasak:

  • Klaszterezés. Az adathalmaz felosztása csoportokra hasonlóság alapján.
  • Anomália észlelése. Szokatlan adatpontok azonosítása egy adathalmazban.
  • Asszociációs bányászat. Az adathalmazban gyakran együtt előforduló elemek halmazainak azonosítása.
  • Dimenziócsökkentés. Az adathalmazban lévő változók számának csökkentése.

Hogyan működik a félig felügyelt tanulás

A félig felügyelt tanulás úgy működik, hogy az adattudósok kis mennyiségű címkézett képzési adatot táplálnak egy algoritmusba. Ebből az algoritmus megtanulja az adathalmaz dimenzióit, amelyeket aztán új, címkézetlen adatokra tud alkalmazni. Az algoritmusok teljesítménye jellemzően javul, ha címkézett adathalmazokon gyakorolnak. Az adatok címkézése azonban időigényes és költséges lehet. A félig felügyelt tanulás a felügyelt tanulás teljesítménye és a felügyelet nélküli tanulás hatékonysága közötti középutat jelenti. Néhány terület, ahol a félig felügyelt tanulást alkalmazzák:

  • Gépi fordítás. Algoritmusok tanítása a nyelv lefordítására a teljes szótárnál kevesebb szó alapján.
  • Csalásfelismerés. Csalási esetek azonosítása, amikor csak néhány pozitív példa áll rendelkezésre.
  • Adatok címkézése. A kis adathalmazokon betanított algoritmusok megtanulhatják az adatcímkék automatikus alkalmazását nagyobb halmazokra.

Hogyan működik a megerősítő tanulás

A megerősítő tanulás úgy működik, hogy egy algoritmust egy határozott céllal és a cél eléréséhez előírt szabályrendszerrel programozunk. Az adattudósok arra is programozzák az algoritmust, hogy keressen pozitív jutalmakat — amelyeket akkor kap, ha olyan műveletet hajt végre, amely előnyös a végső cél felé –, és kerülje a büntetéseket — amelyeket akkor kap, ha olyan műveletet hajt végre, amely távolabb viszi a végső céltól. A megerősített tanulást gyakran használják olyan területeken, mint:

  • Robotika. A robotok ezzel a technikával megtanulhatnak feladatokat végrehajtani a fizikai világban.
  • Videójátékok. A megerősítéses tanulást arra használták, hogy robotokat tanítsanak meg számos videojátékot játszani.
  • Erőforrás-gazdálkodás. Véges erőforrások és egy meghatározott cél ismeretében a megerősítéses tanulás segíthet a vállalkozásoknak megtervezni, hogyan osszák el az erőforrásokat.
A gépi tanulás olyan, mint a statisztika szteroidokon.

A gépi tanulás felhasználási területei

A gépi tanulást ma már számos alkalmazásban használják. A gépi tanulás működésének talán egyik legismertebb példája a Facebook hírfolyamát működtető ajánlómotor.

A Facebook gépi tanulást használ arra, hogy személyre szabja az egyes tagok hírfolyamát. Ha egy tag gyakran megáll, hogy elolvassa egy adott csoport bejegyzéseit, az ajánlómotor az adott csoport aktivitásából többet fog mutatni a hírfolyamban.

A színfalak mögött a motor megpróbálja megerősíteni a tag online viselkedésének ismert mintáit. Ha a tag megváltoztatja a mintákat, és az elkövetkező hetekben nem olvassa el az adott csoport bejegyzéseit, a hírfolyam ennek megfelelően módosul.

Az ajánlómotorok mellett a gépi tanulás további felhasználási területei a következők:

Vevői kapcsolatok kezelése — a CRM-szoftverek gépi tanulási modelleket használhatnak az e-mailek elemzésére, és arra ösztönözhetik az értékesítési csapat tagjait, hogy a legfontosabb üzenetekre válaszoljanak először. A fejlettebb rendszerek akár potenciálisan hatékony válaszokat is ajánlhatnak.

Üzleti intelligencia — A BI- és analitikai szállítók gépi tanulást használnak szoftvereikben a potenciálisan fontos adatpontok, adatpontok mintái és anomáliák azonosítására.

Humánerőforrás-informatikai rendszerek — A HRIS-rendszerek gépi tanulási modelleket használhatnak a pályázatok kiszűrésére és a legjobb jelöltek azonosítására egy nyitott pozícióra.

Az önvezető autók — A gépi tanulási algoritmusok akár azt is lehetővé tehetik, hogy egy félautonóm autó felismerjen egy részben látható tárgyat, és figyelmeztesse a vezetőt.

Virtuális asszisztensek — Az intelligens asszisztensek jellemzően felügyelt és nem felügyelt gépi tanulási modelleket kombinálnak a természetes beszéd értelmezéséhez és a kontextus biztosításához.

Hátrányok és hátrányok

A gépi tanulás erőteljes felhasználási eseteket látott az önvezető autók operációs rendszerét alkotó vásárlói viselkedés előrejelzésétől kezdve. De csak azért, mert egyes iparágakban előnyöket tapasztaltak, nem jelenti azt, hogy a gépi tanulásnak nincsenek hátrányai.

Az előnyök tekintetében a gépi tanulás segíthet a vállalkozásoknak abban, hogy mélyebb szinten megértsék ügyfeleiket. A vásárlói adatok gyűjtésével és az időbeli viselkedésekkel való korrelálásával a gépi tanulási algoritmusok asszociációkat tanulhatnak, és segíthetnek a csapatoknak a termékfejlesztési és marketingkezdeményezéseket a vásárlói igényekhez igazítani.

Néhány internetes vállalat a gépi tanulást használja üzleti modelljének elsődleges mozgatórugójaként. Az Uber például algoritmusokat használ a sofőrök és az utasok párosítására. A Google gépi tanulást használ a megfelelő hirdetések megjelenítésére a keresésekben.

A gépi tanulásnak azonban hátrányai is vannak. Az első és legfontosabb, hogy drága lehet. A gépi tanulási projekteket jellemzően adattudósok vezetik, akik magas fizetést kapnak. Ezek a projektek szoftverinfrastruktúrát is igényelnek, ami szintén magas költségekkel járhat.

A gépi tanulás elfogultságának problémája is fennáll. A bizonyos populációkat kizáró vagy hibákat tartalmazó adathalmazokon kiképzett algoritmusok a világról olyan pontatlan modelleket eredményezhetnek, amelyek a legjobb esetben is kudarcot vallanak, rosszabb esetben pedig diszkriminatívak. Ha egy vállalkozás az alapvető üzleti folyamatokat elfogult modellekre alapozza, szabályozási és reputációs károkat szenvedhet.

A megfelelő gépi tanulási modell kiválasztása

A probléma megoldásához szükséges megfelelő gépi tanulási modell kiválasztásának folyamata időigényes lehet, ha nem stratégiailag közelítjük meg.

1. lépés: Igazítsa a problémát a megoldáshoz figyelembe veendő potenciális adatbevitellel. Ehhez a lépéshez olyan adattudósok és szakértők segítségére van szükség, akik mélyen ismerik a problémát.

2. lépés: Gyűjtse össze az adatokat, formázza meg és címkézze fel őket, ha szükséges. Ezt a lépést jellemzően az adattudósok vezetik, az adatkezelők segítségével.

3. lépés: Válassza ki a használni kívánt algoritmus(oka)t, és tesztelje, hogy milyen jól teljesítenek. Ezt a lépést általában az adattudósok végzik.

4. lépés: Folytassa a kimenetek finomhangolását, amíg el nem érik az elfogadható pontossági szintet. Ezt a lépést általában adattudósok végzik, a problémát mélyen ismerő szakértők visszajelzésével.

A gépi tanulás emberi értelmezhetőségének fontossága

A konkrét ML-modell működésének magyarázata kihívást jelenthet, ha a modell összetett. Vannak olyan vertikális iparágak, ahol az adattudósoknak egyszerű gépi tanulási modelleket kell használniuk, mert az üzlet számára fontos, hogy megmagyarázza, hogyan született minden egyes döntés. Ez különösen igaz azokra az iparágakra, ahol nagy a megfelelési teher, mint például a banki és a biztosítási szektor.

A komplex modellek pontos előrejelzésekre képesek, de egy laikus számára nehéz lehet megmagyarázni, hogyan határozták meg a kimenetet.

A gépi tanulás jövője

A gépi tanulási algoritmusok már évtizedek óta léteznek, de a mesterséges intelligencia (AI) előtérbe kerülésével új népszerűségre tettek szert. Különösen a mélytanulási modellek működtetik napjaink legfejlettebb AI-alkalmazásait.

A gépi tanulási platformok a vállalati technológia legversenyképesebb területei közé tartoznak, a legtöbb nagy gyártó, köztük az Amazon, a Google, a Microsoft, az IBM és mások versenyeznek azért, hogy az ügyfelek olyan platformszolgáltatásokra szerződjenek, amelyek lefedik a gépi tanulási tevékenységek spektrumát, beleértve az adatgyűjtést, az adatelőkészítést, az adatok osztályozását, a modellépítést, a képzést és az alkalmazások telepítését.

Mivel a gépi tanulás egyre nagyobb jelentőséget kap az üzleti műveletekben, és a mesterséges intelligencia egyre gyakorlatiasabbá válik a vállalati környezetben, a gépi tanulási platformháborúk csak fokozódni fognak.

A mélytanulás a hagyományos gépi tanulástól nagyon eltérő módon működik.

A mélytanulás és az AI folyamatos kutatása egyre inkább az általánosabb alkalmazások fejlesztésére összpontosít. A mai mesterséges intelligencia modellek kiterjedt képzést igényelnek ahhoz, hogy egy adott feladat elvégzésére erősen optimalizált algoritmus jöjjön létre. Egyes kutatók azonban azt vizsgálják, hogyan lehet a modelleket rugalmasabbá tenni, és olyan technikákat keresnek, amelyek lehetővé teszik, hogy egy gép az egyik feladatból megtanult összefüggéseket a jövőbeli, különböző feladatokra is alkalmazza.

A gépi tanulás története

1642 – Blaise Pascal feltalál egy mechanikus gépet, amely képes összeadni, kivonni, szorozni és osztani.

1679 – Gottfried Wilhelm Leibniz kitalálja a bináris kódrendszerét.

1834 – Charles Babbage kitalálja egy általános, lyukkártyákkal programozható, univerzális eszköz ötletét.

1842 – Ada Lovelace leír egy műveletsort a matematikai problémák megoldására Charles Babbage elméleti lyukkártyás gépével, és ő lesz az első programozó.

1847 – George Boole megalkotja a Boole-logikát, az algebra olyan formáját, amelyben minden érték visszavezethető az igaz vagy hamis bináris értékekre.

1936 – Alan Turing angol logikus és kriptoelemző olyan univerzális gépet javasol, amely képes megfejteni és végrehajtani egy utasításkészletet. Közzétett bizonyítását a számítástechnika alapjának tekintik.

1952 – Arthur Samuel olyan programot készít, amelynek segítségével egy IBM számítógép annál jobban tud dámázni, minél többet játszik.

1959 – A MADALINE lesz az első mesterséges neurális hálózat, amelyet valós problémára alkalmaznak: a visszhangok eltávolítására a telefonvonalakból.

1985 – Terry Sejnowski és Charles Rosenberg mesterséges neurális hálózata egy hét alatt megtanította magát 20 000 szó helyes kiejtésére.

1997 – Az IBM Deep Blue legyőzte Garri Kaszparov sakknagymestert.

1999 – Egy CAD prototípus intelligens munkaállomás 22 000 mammográfiát vizsgált meg, és 52%-kal pontosabban észlelte a rákot, mint a radiológusok.

2006 – Geoffrey Hinton informatikus találta fel a mélytanulás kifejezést a neurális hálózatok kutatásának leírására.

2012 – A Google által létrehozott, felügyelet nélküli neurális hálózat 74,8%-os pontossággal megtanulta felismerni a macskákat a YouTube-videókban.

2014 – Egy chatbot átment a Turing-teszten, mivel az emberi bírák 33%-át meggyőzte arról, hogy egy Eugene Goostman nevű ukrán tinédzser volt.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük