Uczenie maszynowe (ML) jest rodzajem sztucznej inteligencji (AI), która pozwala aplikacjom stać się bardziej dokładnymi w przewidywaniu wyników bez bycia wyraźnie zaprogramowanym, aby to zrobić. Algorytmy uczenia maszynowego wykorzystują dane historyczne jako dane wejściowe do przewidywania nowych wartości wyjściowych.
Silniki rekomendacji są powszechnym przypadkiem zastosowania uczenia maszynowego. Inne popularne zastosowania obejmują wykrywanie oszustw, filtrowanie spamu, wykrywanie zagrożenia złośliwym oprogramowaniem, automatyzację procesów biznesowych (BPA) i konserwację predykcyjną.
- Typy uczenia maszynowego
- Jak działa nadzorowane uczenie maszynowe
- Jak działa nienadzorowane uczenie maszynowe
- Jak działa uczenie półnadzorowane
- Jak działa uczenie wzmacniające
- Użycia uczenia maszynowego
- Wady i zalety
- Wybór właściwego modelu uczenia maszynowego
- Ważność uczenia maszynowego interpretowanego przez człowieka
- Przyszłość uczenia maszynowego
- Historia uczenia maszynowego
Typy uczenia maszynowego
Klasyczne uczenie maszynowe jest często kategoryzowane według sposobu, w jaki algorytm uczy się, aby stać się bardziej dokładnym w swoich przewidywaniach. Istnieją cztery podstawowe podejścia: uczenie nadzorowane, uczenie nienadzorowane, uczenie półnadzorowane i uczenie wzmacniające. Typ algorytmu, który wybiera naukowiec, zależy od rodzaju danych, które chce przewidzieć.
- Uczenie nadzorowane. W tym typie uczenia maszynowego naukowcy dostarczają algorytmom dane treningowe z etykietami i definiują zmienne, które algorytm ma ocenić pod kątem korelacji. Zarówno dane wejściowe, jak i wyjściowe algorytmu są określone.
- Uczenie nienadzorowane. Ten rodzaj uczenia maszynowego obejmuje algorytmy, które trenują na nieoznakowanych danych. Algorytm przeszukuje zbiory danych w poszukiwaniu jakichkolwiek znaczących powiązań. Zarówno dane, na których algorytmy trenują, jak i przewidywania lub zalecenia, które wydają, są z góry określone.
- Uczenie częściowo nadzorowane. To podejście do uczenia maszynowego obejmuje mieszankę dwóch poprzednich typów. Naukowcy mogą podawać algorytmowi w większości etykietowane dane treningowe, ale model może samodzielnie eksplorować dane i rozwijać swoje własne zrozumienie zbioru danych.
- Uczenie wzmacniające. Reinforcement learning jest zazwyczaj używany do uczenia maszyny, aby wykonała wieloetapowy proces, dla którego istnieją jasno określone reguły. Naukowcy programują algorytm, aby wykonał zadanie i dają mu pozytywne lub negatywne wskazówki, jak ma wykonać zadanie. Ale w przeważającej części algorytm sam decyduje, jakie kroki podjąć po drodze.
Jak działa nadzorowane uczenie maszynowe
Nadzorowane uczenie maszynowe wymaga od naukowca danych wytrenowania algorytmu zarówno z etykietowanymi danymi wejściowymi, jak i pożądanymi danymi wyjściowymi. Algorytmy uczenia nadzorowanego są dobre do następujących zadań:
- Klasyfikacja binarna. Dzielenie danych na dwie kategorie.
- Klasyfikacja wieloklasowa. Wybór pomiędzy więcej niż dwoma typami odpowiedzi.
- Modelowanie regresji. Przewidywanie wartości ciągłych.
- Ensembling. Łączenie przewidywań wielu modeli uczenia maszynowego w celu uzyskania dokładnych przewidywań.
Jak działa nienadzorowane uczenie maszynowe
Algorytmy nienadzorowanego uczenia maszynowego nie wymagają etykietowania danych. Przesiewają one nieoznakowane dane w poszukiwaniu wzorców, które można wykorzystać do grupowania punktów danych w podzbiory. Większość typów głębokiego uczenia, w tym sieci neuronowe, to algorytmy nienadzorowane. Algorytmy uczenia nienadzorowanego są dobre do następujących zadań:
- Klasteryzacja. Dzielenie zbioru danych na grupy na podstawie podobieństwa.
- Wykrywanie anomalii. Identyfikacja nietypowych punktów danych w zbiorze danych.
- Eksploracja asocjacyjna. Identyfikacja zbiorów elementów w zbiorze danych, które często występują razem.
- Redukcja wymiarowości. Redukcja liczby zmiennych w zbiorze danych.
Jak działa uczenie półnadzorowane
Uczenie półnadzorowane polega na dostarczeniu przez naukowców niewielkiej ilości etykietowanych danych treningowych do algorytmu. Na tej podstawie algorytm uczy się wymiarów zbioru danych, które może następnie zastosować do nowych, nieoznakowanych danych. Wydajność algorytmów zazwyczaj poprawia się, gdy trenują one na zbiorach danych oznaczonych etykietami. Jednak etykietowanie danych może być czasochłonne i kosztowne. Uczenie półnadzorowane znajduje się w środku drogi pomiędzy wydajnością uczenia nadzorowanego a efektywnością uczenia nienadzorowanego. Niektóre obszary, w których stosuje się uczenie półnadzorowane, obejmują:
- Tłumaczenie maszynowe. Uczenie algorytmów tłumaczenia języka w oparciu o mniej niż pełny słownik wyrazów.
- Wykrywanie oszustw. Identyfikowanie przypadków oszustw, gdy mamy tylko kilka pozytywnych przykładów.
- Etykietowanie danych. Algorytmy trenowane na małych zbiorach danych mogą nauczyć się automatycznie stosować etykiety do większych zbiorów.
Jak działa uczenie wzmacniające
Uczenie wzmacniające działa poprzez zaprogramowanie algorytmu z określonym celem i przepisanym zestawem reguł do osiągnięcia tego celu. Naukowcy programują również algorytm tak, aby szukał pozytywnych nagród – które otrzymuje, gdy wykonuje działanie korzystne dla osiągnięcia ostatecznego celu – i unikał kar – które otrzymuje, gdy wykonuje działanie oddalające go od ostatecznego celu. Uczenie wzmacniające jest często stosowane w takich dziedzinach jak:
- Robotyka. Roboty mogą nauczyć się wykonywać zadania w świecie fizycznym za pomocą tej techniki.
- Gry wideo. Reinforcement learning został wykorzystany do nauczenia botów grania w wiele gier wideo.
- Zarządzanie zasobami. Biorąc pod uwagę ograniczone zasoby i zdefiniowany cel, uczenie wzmocnień może pomóc przedsiębiorstwom zaplanować, jak przydzielić zasoby.
Użycia uczenia maszynowego
Dzisiaj uczenie maszynowe jest wykorzystywane w szerokim zakresie zastosowań. Być może jednym z najbardziej znanych przykładów uczenia maszynowego w akcji jest silnik rekomendacji, który zasila News Feed Facebooka.
Facebook wykorzystuje uczenie maszynowe do personalizacji sposobu dostarczania informacji dla każdego użytkownika. Jeśli członek często zatrzymuje się, aby przeczytać posty konkretnej grupy, silnik rekomendacji zacznie pokazywać więcej aktywności tej grupy wcześniej w paszy.
Za kulisami, silnik stara się wzmocnić znane wzorce w zachowaniu online członka. Jeśli członek zmieni wzorce i nie będzie czytał postów z tej grupy w nadchodzących tygodniach, News Feed odpowiednio się dostosuje.
Oprócz silników rekomendacji, inne zastosowania uczenia maszynowego obejmują następujące elementy:
Zarządzanie relacjami z klientami — oprogramowanie CRM może wykorzystywać modele uczenia maszynowego do analizowania poczty elektronicznej i podpowiadać członkom zespołu sprzedaży, aby w pierwszej kolejności odpowiadali na najważniejsze wiadomości. Bardziej zaawansowane systemy mogą nawet rekomendować potencjalnie skuteczne odpowiedzi.
Business intelligence — dostawcy rozwiązań BI i analitycznych wykorzystują uczenie maszynowe w swoim oprogramowaniu do identyfikacji potencjalnie ważnych punktów danych, wzorców punktów danych i anomalii.
Systemy informacji o zasobach ludzkich — systemy HRIS mogą wykorzystywać modele uczenia maszynowego do filtrowania aplikacji i identyfikacji najlepszych kandydatów na wolne stanowisko.
Samojeżdżące samochody — Algorytmy uczenia maszynowego mogą nawet umożliwić półautonomicznemu samochodowi rozpoznanie częściowo widocznego obiektu i zaalarmowanie kierowcy.
Wirtualni asystenci — Inteligentni asystenci zazwyczaj łączą nadzorowane i nienadzorowane modele uczenia maszynowego, aby interpretować naturalną mowę i dostarczać kontekst.
Wady i zalety
Uczenie maszynowe doczekało się potężnych przypadków użycia, począwszy od przewidywania zachowań klientów, a skończywszy na systemie operacyjnym dla samojeżdżących samochodów. Ale to, że niektóre branże dostrzegły korzyści, nie oznacza, że uczenie maszynowe jest pozbawione wad.
Jeśli chodzi o zalety, uczenie maszynowe może pomóc przedsiębiorstwom zrozumieć swoich klientów na głębszym poziomie. Zbierając dane o klientach i korelując je z zachowaniami w czasie, algorytmy uczenia maszynowego mogą uczyć się skojarzeń i pomagać zespołom w dostosowywaniu rozwoju produktów i inicjatyw marketingowych do zapotrzebowania klientów.
Niektóre firmy internetowe wykorzystują uczenie maszynowe jako główny czynnik w swoich modelach biznesowych. Uber, na przykład, używa algorytmów do dopasowania kierowców do kierowców. Google wykorzystuje uczenie maszynowe do wyświetlania odpowiednich reklam w wyszukiwaniach.
Ale uczenie maszynowe ma swoje wady. Po pierwsze i najważniejsze, może być drogie. Projekty uczenia maszynowego są zazwyczaj prowadzone przez naukowców zajmujących się danymi, którzy otrzymują wysokie wynagrodzenia. Projekty te wymagają również infrastruktury oprogramowania, która może być bardzo kosztowna.
Istnieje również problem stronniczości uczenia maszynowego. Algorytmy trenowane na zbiorach danych, które wykluczają pewne populacje lub zawierają błędy, mogą prowadzić do niedokładnych modeli świata, które w najlepszym przypadku zawodzą, a w najgorszym są dyskryminujące. Kiedy przedsiębiorstwo opiera kluczowe procesy biznesowe na nieobiektywnych modelach, może narazić się na szkody regulacyjne i utratę reputacji.
Wybór właściwego modelu uczenia maszynowego
Proces wyboru właściwego modelu uczenia maszynowego do rozwiązania problemu może być czasochłonny, jeśli nie podejdzie się do niego strategicznie.
Krok 1: Dostosuj problem do potencjalnych danych wejściowych, które powinny być uwzględnione w rozwiązaniu. Ten krok wymaga pomocy ze strony naukowców zajmujących się danymi i ekspertów, którzy mają głębokie zrozumienie problemu.
Krok 2: Zbieranie danych, formatowanie ich i etykietowanie w razie potrzeby. Ten krok jest zwykle prowadzony przez naukowców danych, z pomocą wranglerów danych.
Krok 3: Wybierz algorytm(y) do użycia i przetestuj, aby zobaczyć, jak dobrze działają. Ten krok jest zwykle wykonywany przez naukowców.
Krok 4: Kontynuuj dostrajanie danych wyjściowych, aż osiągną akceptowalny poziom dokładności. Ten krok jest zwykle wykonywany przez naukowców danych z informacją zwrotną od ekspertów, którzy mają głębokie zrozumienie problemu.
Ważność uczenia maszynowego interpretowanego przez człowieka
Wyjaśnienie, jak działa konkretny model ML może być wyzwaniem, gdy model jest złożony. Istnieją pewne branże wertykalne, w których naukowcy danych muszą używać prostych modeli uczenia maszynowego, ponieważ dla biznesu ważne jest, aby wyjaśnić, w jaki sposób każda decyzja została podjęta. Jest to szczególnie prawdziwe w branżach o dużym obciążeniu zgodnością, takich jak bankowość i ubezpieczenia.
Złożone modele mogą precyzyjnie przewidywać, ale wyjaśnienie laikowi, w jaki sposób dane wyjściowe zostały określone, może być trudne.
Przyszłość uczenia maszynowego
Ale algorytmy uczenia maszynowego istnieją od dziesięcioleci, zyskały one nową popularność wraz ze wzrostem znaczenia sztucznej inteligencji (AI). W szczególności modele głębokiego uczenia zasilają najbardziej zaawansowane aplikacje AI.
Platformy uczenia maszynowego należą do najbardziej konkurencyjnych obszarów technologii dla przedsiębiorstw, a większość głównych dostawców, w tym Amazon, Google, Microsoft, IBM i inni, ściga się w podpisywaniu umów z klientami na usługi platformowe, które obejmują spektrum działań związanych z uczeniem maszynowym, w tym gromadzenie danych, przygotowanie danych, klasyfikację danych, tworzenie modeli, szkolenie i wdrażanie aplikacji.
Ponieważ uczenie maszynowe nadal zwiększa swoje znaczenie dla operacji biznesowych, a AI staje się coraz bardziej praktyczna w ustawieniach przedsiębiorstw, wojny o platformy uczenia maszynowego będą się tylko nasilać.