uczenie maszynowe

Uczenie maszynowe (ML) jest rodzajem sztucznej inteligencji (AI), która pozwala aplikacjom stać się bardziej dokładnymi w przewidywaniu wyników bez bycia wyraźnie zaprogramowanym, aby to zrobić. Algorytmy uczenia maszynowego wykorzystują dane historyczne jako dane wejściowe do przewidywania nowych wartości wyjściowych.

Silniki rekomendacji są powszechnym przypadkiem zastosowania uczenia maszynowego. Inne popularne zastosowania obejmują wykrywanie oszustw, filtrowanie spamu, wykrywanie zagrożenia złośliwym oprogramowaniem, automatyzację procesów biznesowych (BPA) i konserwację predykcyjną.

Typy uczenia maszynowego

Klasyczne uczenie maszynowe jest często kategoryzowane według sposobu, w jaki algorytm uczy się, aby stać się bardziej dokładnym w swoich przewidywaniach. Istnieją cztery podstawowe podejścia: uczenie nadzorowane, uczenie nienadzorowane, uczenie półnadzorowane i uczenie wzmacniające. Typ algorytmu, który wybiera naukowiec, zależy od rodzaju danych, które chce przewidzieć.

  • Uczenie nadzorowane. W tym typie uczenia maszynowego naukowcy dostarczają algorytmom dane treningowe z etykietami i definiują zmienne, które algorytm ma ocenić pod kątem korelacji. Zarówno dane wejściowe, jak i wyjściowe algorytmu są określone.
  • Uczenie nienadzorowane. Ten rodzaj uczenia maszynowego obejmuje algorytmy, które trenują na nieoznakowanych danych. Algorytm przeszukuje zbiory danych w poszukiwaniu jakichkolwiek znaczących powiązań. Zarówno dane, na których algorytmy trenują, jak i przewidywania lub zalecenia, które wydają, są z góry określone.
  • Uczenie częściowo nadzorowane. To podejście do uczenia maszynowego obejmuje mieszankę dwóch poprzednich typów. Naukowcy mogą podawać algorytmowi w większości etykietowane dane treningowe, ale model może samodzielnie eksplorować dane i rozwijać swoje własne zrozumienie zbioru danych.
  • Uczenie wzmacniające. Reinforcement learning jest zazwyczaj używany do uczenia maszyny, aby wykonała wieloetapowy proces, dla którego istnieją jasno określone reguły. Naukowcy programują algorytm, aby wykonał zadanie i dają mu pozytywne lub negatywne wskazówki, jak ma wykonać zadanie. Ale w przeważającej części algorytm sam decyduje, jakie kroki podjąć po drodze.

Jak działa nadzorowane uczenie maszynowe

Nadzorowane uczenie maszynowe wymaga od naukowca danych wytrenowania algorytmu zarówno z etykietowanymi danymi wejściowymi, jak i pożądanymi danymi wyjściowymi. Algorytmy uczenia nadzorowanego są dobre do następujących zadań:

  • Klasyfikacja binarna. Dzielenie danych na dwie kategorie.
  • Klasyfikacja wieloklasowa. Wybór pomiędzy więcej niż dwoma typami odpowiedzi.
  • Modelowanie regresji. Przewidywanie wartości ciągłych.
  • Ensembling. Łączenie przewidywań wielu modeli uczenia maszynowego w celu uzyskania dokładnych przewidywań.

Jak działa nienadzorowane uczenie maszynowe

Algorytmy nienadzorowanego uczenia maszynowego nie wymagają etykietowania danych. Przesiewają one nieoznakowane dane w poszukiwaniu wzorców, które można wykorzystać do grupowania punktów danych w podzbiory. Większość typów głębokiego uczenia, w tym sieci neuronowe, to algorytmy nienadzorowane. Algorytmy uczenia nienadzorowanego są dobre do następujących zadań:

  • Klasteryzacja. Dzielenie zbioru danych na grupy na podstawie podobieństwa.
  • Wykrywanie anomalii. Identyfikacja nietypowych punktów danych w zbiorze danych.
  • Eksploracja asocjacyjna. Identyfikacja zbiorów elementów w zbiorze danych, które często występują razem.
  • Redukcja wymiarowości. Redukcja liczby zmiennych w zbiorze danych.

Jak działa uczenie półnadzorowane

Uczenie półnadzorowane polega na dostarczeniu przez naukowców niewielkiej ilości etykietowanych danych treningowych do algorytmu. Na tej podstawie algorytm uczy się wymiarów zbioru danych, które może następnie zastosować do nowych, nieoznakowanych danych. Wydajność algorytmów zazwyczaj poprawia się, gdy trenują one na zbiorach danych oznaczonych etykietami. Jednak etykietowanie danych może być czasochłonne i kosztowne. Uczenie półnadzorowane znajduje się w środku drogi pomiędzy wydajnością uczenia nadzorowanego a efektywnością uczenia nienadzorowanego. Niektóre obszary, w których stosuje się uczenie półnadzorowane, obejmują:

  • Tłumaczenie maszynowe. Uczenie algorytmów tłumaczenia języka w oparciu o mniej niż pełny słownik wyrazów.
  • Wykrywanie oszustw. Identyfikowanie przypadków oszustw, gdy mamy tylko kilka pozytywnych przykładów.
  • Etykietowanie danych. Algorytmy trenowane na małych zbiorach danych mogą nauczyć się automatycznie stosować etykiety do większych zbiorów.

Jak działa uczenie wzmacniające

Uczenie wzmacniające działa poprzez zaprogramowanie algorytmu z określonym celem i przepisanym zestawem reguł do osiągnięcia tego celu. Naukowcy programują również algorytm tak, aby szukał pozytywnych nagród – które otrzymuje, gdy wykonuje działanie korzystne dla osiągnięcia ostatecznego celu – i unikał kar – które otrzymuje, gdy wykonuje działanie oddalające go od ostatecznego celu. Uczenie wzmacniające jest często stosowane w takich dziedzinach jak:

  • Robotyka. Roboty mogą nauczyć się wykonywać zadania w świecie fizycznym za pomocą tej techniki.
  • Gry wideo. Reinforcement learning został wykorzystany do nauczenia botów grania w wiele gier wideo.
  • Zarządzanie zasobami. Biorąc pod uwagę ograniczone zasoby i zdefiniowany cel, uczenie wzmocnień może pomóc przedsiębiorstwom zaplanować, jak przydzielić zasoby.

Uczenie maszynowe jest jak statystyka na sterydach.

Użycia uczenia maszynowego

Dzisiaj uczenie maszynowe jest wykorzystywane w szerokim zakresie zastosowań. Być może jednym z najbardziej znanych przykładów uczenia maszynowego w akcji jest silnik rekomendacji, który zasila News Feed Facebooka.

Facebook wykorzystuje uczenie maszynowe do personalizacji sposobu dostarczania informacji dla każdego użytkownika. Jeśli członek często zatrzymuje się, aby przeczytać posty konkretnej grupy, silnik rekomendacji zacznie pokazywać więcej aktywności tej grupy wcześniej w paszy.

Za kulisami, silnik stara się wzmocnić znane wzorce w zachowaniu online członka. Jeśli członek zmieni wzorce i nie będzie czytał postów z tej grupy w nadchodzących tygodniach, News Feed odpowiednio się dostosuje.

Oprócz silników rekomendacji, inne zastosowania uczenia maszynowego obejmują następujące elementy:

Zarządzanie relacjami z klientami — oprogramowanie CRM może wykorzystywać modele uczenia maszynowego do analizowania poczty elektronicznej i podpowiadać członkom zespołu sprzedaży, aby w pierwszej kolejności odpowiadali na najważniejsze wiadomości. Bardziej zaawansowane systemy mogą nawet rekomendować potencjalnie skuteczne odpowiedzi.

Business intelligence — dostawcy rozwiązań BI i analitycznych wykorzystują uczenie maszynowe w swoim oprogramowaniu do identyfikacji potencjalnie ważnych punktów danych, wzorców punktów danych i anomalii.

Systemy informacji o zasobach ludzkich — systemy HRIS mogą wykorzystywać modele uczenia maszynowego do filtrowania aplikacji i identyfikacji najlepszych kandydatów na wolne stanowisko.

Samojeżdżące samochody — Algorytmy uczenia maszynowego mogą nawet umożliwić półautonomicznemu samochodowi rozpoznanie częściowo widocznego obiektu i zaalarmowanie kierowcy.

Wirtualni asystenci — Inteligentni asystenci zazwyczaj łączą nadzorowane i nienadzorowane modele uczenia maszynowego, aby interpretować naturalną mowę i dostarczać kontekst.

Wady i zalety

Uczenie maszynowe doczekało się potężnych przypadków użycia, począwszy od przewidywania zachowań klientów, a skończywszy na systemie operacyjnym dla samojeżdżących samochodów. Ale to, że niektóre branże dostrzegły korzyści, nie oznacza, że uczenie maszynowe jest pozbawione wad.

Jeśli chodzi o zalety, uczenie maszynowe może pomóc przedsiębiorstwom zrozumieć swoich klientów na głębszym poziomie. Zbierając dane o klientach i korelując je z zachowaniami w czasie, algorytmy uczenia maszynowego mogą uczyć się skojarzeń i pomagać zespołom w dostosowywaniu rozwoju produktów i inicjatyw marketingowych do zapotrzebowania klientów.

Niektóre firmy internetowe wykorzystują uczenie maszynowe jako główny czynnik w swoich modelach biznesowych. Uber, na przykład, używa algorytmów do dopasowania kierowców do kierowców. Google wykorzystuje uczenie maszynowe do wyświetlania odpowiednich reklam w wyszukiwaniach.

Ale uczenie maszynowe ma swoje wady. Po pierwsze i najważniejsze, może być drogie. Projekty uczenia maszynowego są zazwyczaj prowadzone przez naukowców zajmujących się danymi, którzy otrzymują wysokie wynagrodzenia. Projekty te wymagają również infrastruktury oprogramowania, która może być bardzo kosztowna.

Istnieje również problem stronniczości uczenia maszynowego. Algorytmy trenowane na zbiorach danych, które wykluczają pewne populacje lub zawierają błędy, mogą prowadzić do niedokładnych modeli świata, które w najlepszym przypadku zawodzą, a w najgorszym są dyskryminujące. Kiedy przedsiębiorstwo opiera kluczowe procesy biznesowe na nieobiektywnych modelach, może narazić się na szkody regulacyjne i utratę reputacji.

Wybór właściwego modelu uczenia maszynowego

Proces wyboru właściwego modelu uczenia maszynowego do rozwiązania problemu może być czasochłonny, jeśli nie podejdzie się do niego strategicznie.

Krok 1: Dostosuj problem do potencjalnych danych wejściowych, które powinny być uwzględnione w rozwiązaniu. Ten krok wymaga pomocy ze strony naukowców zajmujących się danymi i ekspertów, którzy mają głębokie zrozumienie problemu.

Krok 2: Zbieranie danych, formatowanie ich i etykietowanie w razie potrzeby. Ten krok jest zwykle prowadzony przez naukowców danych, z pomocą wranglerów danych.

Krok 3: Wybierz algorytm(y) do użycia i przetestuj, aby zobaczyć, jak dobrze działają. Ten krok jest zwykle wykonywany przez naukowców.

Krok 4: Kontynuuj dostrajanie danych wyjściowych, aż osiągną akceptowalny poziom dokładności. Ten krok jest zwykle wykonywany przez naukowców danych z informacją zwrotną od ekspertów, którzy mają głębokie zrozumienie problemu.

Ważność uczenia maszynowego interpretowanego przez człowieka

Wyjaśnienie, jak działa konkretny model ML może być wyzwaniem, gdy model jest złożony. Istnieją pewne branże wertykalne, w których naukowcy danych muszą używać prostych modeli uczenia maszynowego, ponieważ dla biznesu ważne jest, aby wyjaśnić, w jaki sposób każda decyzja została podjęta. Jest to szczególnie prawdziwe w branżach o dużym obciążeniu zgodnością, takich jak bankowość i ubezpieczenia.

Złożone modele mogą precyzyjnie przewidywać, ale wyjaśnienie laikowi, w jaki sposób dane wyjściowe zostały określone, może być trudne.

Przyszłość uczenia maszynowego

Ale algorytmy uczenia maszynowego istnieją od dziesięcioleci, zyskały one nową popularność wraz ze wzrostem znaczenia sztucznej inteligencji (AI). W szczególności modele głębokiego uczenia zasilają najbardziej zaawansowane aplikacje AI.

Platformy uczenia maszynowego należą do najbardziej konkurencyjnych obszarów technologii dla przedsiębiorstw, a większość głównych dostawców, w tym Amazon, Google, Microsoft, IBM i inni, ściga się w podpisywaniu umów z klientami na usługi platformowe, które obejmują spektrum działań związanych z uczeniem maszynowym, w tym gromadzenie danych, przygotowanie danych, klasyfikację danych, tworzenie modeli, szkolenie i wdrażanie aplikacji.

Ponieważ uczenie maszynowe nadal zwiększa swoje znaczenie dla operacji biznesowych, a AI staje się coraz bardziej praktyczna w ustawieniach przedsiębiorstw, wojny o platformy uczenia maszynowego będą się tylko nasilać.

Głębokie uczenie działa w bardzo różny sposób od tradycyjnego uczenia maszynowego.

Ciągłe badania nad głębokim uczeniem i AI coraz bardziej koncentrują się na opracowywaniu bardziej ogólnych zastosowań. Dzisiejsze modele AI wymagają intensywnego szkolenia w celu wytworzenia algorytmu, który jest wysoce zoptymalizowany do wykonywania jednego zadania. Jednak niektórzy badacze poszukują sposobów na uczynienie modeli bardziej elastycznymi i szukają technik, które pozwolą maszynie zastosować kontekst wyuczony z jednego zadania do przyszłych, różnych zadań.

Historia uczenia maszynowego

1642 – Blaise Pascal wynajduje maszynę mechaniczną, która potrafi dodawać, odejmować, mnożyć i dzielić.

1679 – Gottfried Wilhelm Leibniz opracowuje system kodu binarnego.

1834 – Charles Babbage wpada na pomysł ogólnego urządzenia uniwersalnego, które można by programować za pomocą kart perforowanych.

1842 – Ada Lovelace opisuje sekwencję operacji służących do rozwiązywania problemów matematycznych przy użyciu teoretycznej maszyny dziurkowanej Charlesa Babbage’a i zostaje pierwszą programistką.

1847 – George Boole tworzy logikę Boole’a, formę algebry, w której wszystkie wartości można sprowadzić do wartości binarnych prawda lub fałsz.

1936 – angielski logik i kryptoanalityk Alan Turing proponuje uniwersalną maszynę, która mogłaby odszyfrować i wykonać zestaw instrukcji. Jego opublikowany dowód jest uważany za podstawę informatyki.

1952 – Arthur Samuel tworzy program, dzięki któremu komputer IBM staje się tym lepszy w warcaby, im więcej gra.

1959 – MADALINE staje się pierwszą sztuczną siecią neuronową zastosowaną do rzeczywistego problemu: usuwania echa z linii telefonicznych.

1985 – sztuczna sieć neuronowa Terry’ego Sejnowskiego i Charlesa Rosenberga uczy się poprawnej wymowy 20 000 słów w ciągu jednego tygodnia.

1997 – Deep Blue firmy IBM pokonuje arcymistrza szachowego Garry’ego Kasparowa.

1999 – prototypowa inteligentna stacja robocza CAD przegląda 22 000 mammogramów i wykrywa raka o 52% dokładniej niż radiologowie.

2006 – Informatyk Geoffrey Hinton wymyśla termin deep learning (głębokie uczenie), aby opisać badania nad sieciami neuronowymi.

2012 – Sieć neuronowa bez nadzoru stworzona przez firmę Google uczy się rozpoznawać koty w filmach wideo w serwisie YouTube z dokładnością 74,8%.

2014 – Chatbot przechodzi test Turinga, przekonując 33% ludzkich sędziów, że jest ukraińskim nastolatkiem o imieniu Eugene Goostman.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *