Co je strojové učení (ML)?

Strojové učení (ML) je druh umělé inteligence (AI), který umožňuje softwarovým aplikacím zpřesňovat předpovědi výsledků, aniž by k tomu byly výslovně naprogramovány. Algoritmy strojového učení používají jako vstup historická data k předpovídání nových výstupních hodnot.

Běžným případem použití strojového učení jsou doporučovací systémy. Mezi další oblíbená použití patří detekce podvodů, filtrování nevyžádané pošty, detekce hrozeb malwaru, automatizace podnikových procesů (BPA) a prediktivní údržba.

Typy strojového učení
Jak funguje strojové učení pod dohledem
Jak funguje strojové učení bez dohledu
Jak funguje částečně řízené učení
Jak funguje posilovací učení
Použití strojového učení
Výhody a nevýhody
Výběr správného modelu strojového učení
Důležitost strojového učení s lidskou interpretací
Budoucnost strojového učení
Historie strojového učení

Typy strojového učení

Klasické strojové učení se často dělí podle toho, jak se algoritmus učí zpřesňovat své předpovědi. Existují čtyři základní přístupy: učení pod dohledem, učení bez dohledu, učení s částečným dohledem a učení s posilováním. Typ algoritmu, který se datový vědec rozhodne použít, závisí na tom, jaký typ dat chce předpovídat.

Učení pod dohledem. Při tomto typu strojového učení datoví vědci dodávají algoritmům označená trénovací data a definují proměnné, které chtějí, aby algoritmus vyhodnotil z hlediska korelací. Zadává se vstup i výstup algoritmu.
Unsupervised learning (učení bez dohledu). Tento typ strojového učení zahrnuje algoritmy, které se trénují na neoznačených datech. Algoritmus prochází soubory dat a hledá jakékoli smysluplné souvislosti. Jak data, na kterých se algoritmy trénují, tak předpovědi nebo doporučení, které jsou jejich výstupem, jsou předem určeny.
Částečně řízené učení. Tento přístup ke strojovému učení zahrnuje kombinaci obou předchozích typů. Datoví vědci mohou algoritmus krmit převážně označenými tréninkovými daty, ale model může data zkoumat sám a rozvíjet své vlastní porozumění souboru dat.
Učení s posilováním. Učení s posilováním se obvykle používá k tomu, aby se stroj naučil dokončit vícekrokový proces, pro který existují jasně definovaná pravidla. Datoví vědci naprogramují algoritmus tak, aby splnil úkol, a dávají mu pozitivní nebo negativní signály, když vymýšlí, jak úkol splnit. Většinou však algoritmus sám rozhoduje o tom, jaké kroky má na své cestě provést.

Jak funguje strojové učení pod dohledem

Supervised machine learning vyžaduje, aby datový vědec trénoval algoritmus s označenými vstupy i požadovanými výstupy. Algoritmy supervidovaného učení jsou vhodné pro následující úlohy:

Binární klasifikace. Rozdělení dat do dvou kategorií.
Klasifikace více tříd. Výběr mezi více než dvěma typy odpovědí.
Regresní modelování. Předpovídání spojitých hodnot.
Ensembling. Kombinování předpovědí více modelů strojového učení za účelem vytvoření přesné předpovědi.

Jak funguje strojové učení bez dohledu

Algoritmy strojového učení bez dohledu nevyžadují, aby byla data označena. Procházejí neoznačená data a hledají vzory, které lze použít k seskupení datových bodů do podmnožin. Většina typů hlubokého učení, včetně neuronových sítí, jsou neřízené algoritmy. Algoritmy neřízeného učení jsou vhodné pro následující úlohy:

Shlukování. Rozdělení souboru dat do skupin na základě podobnosti.
Detekce anomálií. Identifikace neobvyklých datových bodů v souboru dat.
Vytěžování asociací. Identifikace množin položek v souboru dat, které se často vyskytují společně.
Redukce dimenzionality. Snížení počtu proměnných v souboru dat.

Jak funguje částečně řízené učení

Částečně řízené učení funguje tak, že datoví vědci dodávají algoritmu malé množství označených trénovacích dat. Na jejich základě se algoritmus naučí dimenze datové sady, které pak může použít na nová, neoznačená data. Výkonnost algoritmů se obvykle zlepšuje, když se trénují na označených datových sadách. Označování dat však může být časově náročné a nákladné. Učení s částečným dohledem představuje střední cestu mezi výkonností učení s dohledem a efektivitou učení bez dohledu. Mezi oblasti, kde se polopřímé učení používá, patří:

Strojový překlad. Učení algoritmů pro překlad jazyka na základě méně než úplného slovníku slov.
Detekce podvodů. Identifikace případů podvodů, když máte k dispozici jen několik pozitivních příkladů.
Označování dat. Algoritmy vyškolené na malých souborech dat se mohou naučit automaticky aplikovat štítky na větší soubory dat.

Jak funguje posilovací učení

Posilovací učení funguje tak, že naprogramujete algoritmus s jasným cílem a předepsanou sadou pravidel pro dosažení tohoto cíle. Datoví vědci také naprogramují algoritmus tak, aby vyhledával pozitivní odměny – které obdrží, když provede akci, která je prospěšná pro dosažení konečného cíle – a vyhýbal se trestům – které obdrží, když provede akci, která ho od konečného cíle vzdaluje. Učení s posilováním se často používá v oblastech, jako jsou:

Robotika. Roboti se pomocí této techniky mohou učit plnit úkoly ve fyzickém světě.
Hraní videoher. Učení s posilováním se používá k učení robotů hrát řadu videoher.
Správa zdrojů. Vzhledem k omezeným zdrojům a definovanému cíli může reinforcement learning pomoci podnikům plánovat, jak rozdělit zdroje.

Strojové učení je jako statistika na steroidech.

Použití strojového učení

Strojové učení se dnes používá v celé řadě aplikací. Snad jedním z nejznámějších příkladů strojového učení v praxi je doporučovací engine, který pohání News Feed na Facebooku.

Facebook používá strojové učení k personalizaci způsobu doručování zpráv každému uživateli. Pokud se člen často zastavuje u příspěvků určité skupiny, začne doporučovací engine zobrazovat více aktivit této skupiny dříve ve feedu.

V pozadí se engine snaží posílit známé vzorce chování člena na internetu. Pokud člen změní vzorce a nebude v příštích týdnech číst příspěvky z dané skupiny, kanál News Feed se podle toho upraví.

Kromě doporučovacích motorů se strojové učení využívá i v následujících případech:

Řízení vztahů se zákazníky – software CRM může používat modely strojového učení k analýze e-mailů a nabádat členy prodejního týmu, aby nejdříve reagovali na nejdůležitější zprávy. Pokročilejší systémy mohou dokonce doporučovat potenciálně účinné odpovědi.

Business intelligence — Dodavatelé BI a analytických systémů používají ve svém softwaru strojové učení k identifikaci potenciálně důležitých datových bodů, vzorců datových bodů a anomálií.

Informační systémy pro lidské zdroje — Systémy HRIS mohou používat modely strojového učení k filtrování žádostí a identifikaci nejlepších kandidátů na volnou pozici.

Samořídící automobily — Algoritmy strojového učení mohou dokonce umožnit poloautonomnímu automobilu rozpoznat částečně viditelný objekt a upozornit na něj řidiče.

Virtuální asistenti — Chytří asistenti obvykle kombinují modely strojového učení pod dohledem a bez dohledu, aby interpretovali přirozenou řeč a dodávali kontext.

Výhody a nevýhody

Strojové učení zaznamenalo výkonné případy použití od předpovídání chování zákazníků, které tvoří operační systém pro samořídící automobily. Ale to, že některá odvětví zaznamenala výhody, neznamená, že strojové učení je bez nevýhod.

Pokud jde o výhody, strojové učení může podnikům pomoci porozumět zákazníkům na hlubší úrovni. Díky shromažďování dat o zákaznících a jejich korelaci s chováním v průběhu času se algoritmy strojového učení mohou naučit asociace a pomoci týmům přizpůsobit vývoj produktů a marketingové iniciativy poptávce zákazníků.

Některé internetové společnosti používají strojové učení jako hlavní hnací sílu svých obchodních modelů. Například společnost Uber používá algoritmy pro párování řidičů s cestujícími. Společnost Google používá strojové učení k zobrazování správných reklam při vyhledávání.

Společnost Google však strojové učení má i své nevýhody. Především může být drahé. Projekty strojového učení obvykle řídí datoví vědci, kteří mají vysoké platy. Tyto projekty také vyžadují softwarovou infrastrukturu, která může být vysoce nákladná.

Je zde také problém zkreslení strojového učení. Algoritmy vyškolené na souborech dat, které vylučují určité skupiny obyvatel nebo obsahují chyby, mohou vést k nepřesným modelům světa, které v lepším případě selhávají a v horším případě jsou diskriminační. Pokud podnik založí klíčové obchodní procesy na neobjektivních modelech, může se dostat do problémů s regulací a poškozením pověsti.

Výběr správného modelu strojového učení

Proces výběru správného modelu strojového učení pro řešení problému může být časově náročný, pokud se k němu nepřistupuje strategicky.

Krok 1: Srovnejte problém s potenciálními datovými vstupy, které by měly být pro řešení zvažovány. Tento krok vyžaduje pomoc datových vědců a odborníků, kteří mají hluboké znalosti problému.

Krok 2: Shromážděte data, naformátujte je a v případě potřeby je označte. Tento krok obvykle vedou datoví vědci s pomocí zpracovatelů dat.

Krok 3: Vybrat algoritmus (algoritmy), které se použijí, a otestovat, jak dobře fungují. Tento krok obvykle provádějí datoví vědci.

Krok 4: Pokračujte v dolaďování výstupů, dokud nedosáhnou přijatelné úrovně přesnosti. Tento krok obvykle provádějí datoví vědci se zpětnou vazbou od odborníků, kteří problému důkladně rozumí.

Důležitost strojového učení s lidskou interpretací

Vysvětlit, jak konkrétní ML model funguje, může být náročné, pokud je model složitý. V některých vertikálních odvětvích musí datoví vědci používat jednoduché modely strojového učení, protože pro firmu je důležité vysvětlit, jak bylo učiněno každé rozhodnutí. To platí zejména v odvětvích s velkou zátěží spojenou s dodržováním předpisů, jako je bankovnictví a pojišťovnictví.

Složitými modely lze přesně předpovídat, ale vysvětlit laikovi, jak byl výstup určen, může být obtížné.

Budoucnost strojového učení

Agoritmy strojového učení jsou sice známy již desítky let, ale nové popularity dosáhly s růstem významu umělé inteligence (AI). Zejména modely hlubokého učení pohánějí dnešní nejpokročilejší aplikace umělé inteligence.

Platformy strojového učení patří mezi nejkonkurenčnější sféry podnikových technologií a většina hlavních dodavatelů, včetně společností Amazon, Google, Microsoft, IBM a dalších, se předhání v tom, kdo si zaregistruje zákazníky na služby platformy, které pokrývají spektrum činností strojového učení, včetně sběru dat, přípravy dat, klasifikace dat, tvorby modelů, školení a nasazení aplikací.

S tím, jak roste význam strojového učení pro podnikové operace a umělá inteligence se stává stále praktičtější v podnikovém prostředí, budou války o platformy pro strojové učení jen sílit.

Hluboké učení funguje zcela odlišným způsobem než tradiční strojové učení.

Pokračující výzkum hlubokého učení a umělé inteligence se stále více zaměřuje na vývoj obecnějších aplikací. Dnešní modely umělé inteligence vyžadují rozsáhlé školení, aby vznikl algoritmus, který je vysoce optimalizovaný pro provádění jednoho úkolu. Někteří výzkumníci však zkoumají způsoby, jak učinit modely flexibilnějšími, a hledají techniky, které by stroji umožnily aplikovat kontext naučený z jedné úlohy na budoucí, odlišné úlohy.

Historie strojového učení

1642 – Blaise Pascal vynalezl mechanický stroj, který umí sčítat, odčítat, násobit a dělit.

1679 – Gottfried Wilhelm Leibniz vymyslel systém binárního kódu.

1834 – Charles Babbage přišel s myšlenkou obecného univerzálního zařízení, které by se dalo programovat pomocí děrných štítků.

1842 – Ada Lovelace popisuje posloupnost operací pro řešení matematických problémů pomocí teoretického děrnoštítkového stroje Charlese Babbage a stává se první programátorkou.

1847 – George Boole vytváří Booleovu logiku, formu algebry, ve které lze všechny hodnoty redukovat na binární hodnoty pravda nebo nepravda.

1936 – anglický logik a kryptoanalytik Alan Turing navrhuje univerzální stroj, který by dokázal rozluštit a vykonat soubor instrukcí. Jeho publikovaný důkaz je považován za základ informatiky.

1952 – Arthur Samuel vytváří program, který pomáhá počítači IBM zlepšovat se v dámě, čím více hraje.

1959 – MADALINE se stává první umělou neuronovou sítí aplikovanou na reálný problém: odstraňování ozvěn z telefonních linek.

1985 – Umělá neuronová síť Terryho Sejnowského a Charlese Rosenberga se za týden naučila správně vyslovit 20 000 slov.

1997 – Počítač Deep Blue společnosti IBM porazil šachového velmistra Garryho Kasparova.

1999 – Prototyp inteligentní pracovní stanice CAD prohlédl 22 000 mamogramů a odhalil rakovinu o 52 % přesněji než radiologové.

2006 – Počítačový vědec Geoffrey Hinton vymyslel termín hluboké učení pro popis výzkumu neuronových sítí.

2012 – Neuronová síť bez dohledu vytvořená společností Google se naučila rozpoznávat kočky ve videích na YouTube s přesností 74,8 %.

2014 – Chatbot prošel Turingovým testem, když přesvědčil 33 % lidských porotců, že je to ukrajinský teenager jménem Eugene Goostman.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.