Maschinelles Lernen

Maschinelles Lernen (ML) ist eine Art der künstlichen Intelligenz (AI), die es Softwareanwendungen ermöglicht, Ergebnisse genauer vorherzusagen, ohne dass sie explizit dafür programmiert wurden. Algorithmen des maschinellen Lernens verwenden historische Daten als Eingabe, um neue Ausgabewerte vorherzusagen.

Empfehlungsmaschinen sind ein häufiger Anwendungsfall für maschinelles Lernen. Andere beliebte Anwendungen sind Betrugserkennung, Spam-Filterung, Erkennung von Malware-Bedrohungen, Automatisierung von Geschäftsprozessen und vorausschauende Wartung.

Typen des maschinellen Lernens

Klassisches maschinelles Lernen wird oft danach kategorisiert, wie ein Algorithmus lernt, um seine Vorhersagen genauer zu machen. Es gibt vier grundlegende Ansätze: überwachtes Lernen, unüberwachtes Lernen, halbüberwachtes Lernen und verstärkendes Lernen. Für welche Art von Algorithmus sich ein Datenwissenschaftler entscheidet, hängt davon ab, welche Art von Daten er vorhersagen möchte.

  • Überwachtes Lernen. Bei dieser Art des maschinellen Lernens versorgen Datenwissenschaftler die Algorithmen mit markierten Trainingsdaten und definieren die Variablen, die der Algorithmus auf Korrelationen untersuchen soll. Sowohl die Eingabe als auch die Ausgabe des Algorithmus sind festgelegt.
  • Unüberwachtes Lernen. Diese Art des maschinellen Lernens umfasst Algorithmen, die auf nicht beschrifteten Daten trainieren. Der Algorithmus durchsucht Datensätze auf der Suche nach einer sinnvollen Verbindung. Sowohl die Daten, auf denen die Algorithmen trainieren, als auch die Vorhersagen oder Empfehlungen, die sie ausgeben, sind vorherbestimmt.
  • Semi-überwachtes Lernen. Bei diesem Ansatz des maschinellen Lernens handelt es sich um eine Mischung aus den beiden vorangegangenen Typen. Datenwissenschaftler können einen Algorithmus mit größtenteils markierten Trainingsdaten füttern, aber das Modell ist frei, die Daten selbst zu erforschen und sein eigenes Verständnis des Datensatzes zu entwickeln.
  • Verstärkungslernen. Verstärkungslernen wird in der Regel verwendet, um einer Maschine beizubringen, einen mehrstufigen Prozess zu absolvieren, für den es klar definierte Regeln gibt. Datenwissenschaftler programmieren einen Algorithmus so, dass er eine Aufgabe erfüllt, und geben ihm positive oder negative Hinweise, während er herausfindet, wie er eine Aufgabe zu erfüllen hat. In den meisten Fällen entscheidet der Algorithmus jedoch selbst, welche Schritte er auf seinem Weg unternimmt.

Wie überwachtes maschinelles Lernen funktioniert

Beim überwachten maschinellen Lernen muss der Datenwissenschaftler den Algorithmus sowohl mit markierten Eingaben als auch mit gewünschten Ausgaben trainieren. Algorithmen des überwachten Lernens eignen sich für die folgenden Aufgaben:

  • Binäre Klassifizierung. Einteilung von Daten in zwei Kategorien.
  • Mehrklassen-Klassifikation. Auswahl zwischen mehr als zwei Arten von Antworten.
  • Regressionsmodellierung. Vorhersage von kontinuierlichen Werten.
  • Ensembling. Kombinieren der Vorhersagen mehrerer maschineller Lernmodelle, um eine genaue Vorhersage zu erstellen.

Wie unüberwachtes maschinelles Lernen funktioniert

Unüberwachte maschinelle Lernalgorithmen erfordern keine beschrifteten Daten. Sie durchsuchen unmarkierte Daten, um nach Mustern zu suchen, die zur Gruppierung von Datenpunkten in Untergruppen verwendet werden können. Die meisten Arten von Deep Learning, einschließlich neuronaler Netze, sind unüberwachte Algorithmen. Unüberwachte Lernalgorithmen eignen sich für die folgenden Aufgaben:

  • Clustering. Aufteilung des Datensatzes in Gruppen auf der Grundlage von Ähnlichkeit.
  • Anomalieerkennung. Identifizierung ungewöhnlicher Datenpunkte in einem Datensatz.
  • Assoziationsanalyse. Identifizierung von Gruppen von Elementen in einem Datensatz, die häufig zusammen auftreten.
  • Dimensionalitätsreduktion. Reduzierung der Anzahl der Variablen in einem Datensatz.

Wie funktioniert semi-supervised learning

Semi-supervised learning funktioniert, indem Datenwissenschaftler eine kleine Menge markierter Trainingsdaten in einen Algorithmus einspeisen. Daraus lernt der Algorithmus die Dimensionen des Datensatzes, die er dann auf neue, nicht gekennzeichnete Daten anwenden kann. Die Leistung von Algorithmen verbessert sich in der Regel, wenn sie auf markierten Datensätzen trainieren. Die Kennzeichnung von Daten kann jedoch zeitaufwändig und teuer sein. Semi-überwachtes Lernen stellt einen Mittelweg zwischen der Leistung des überwachten Lernens und der Effizienz des unüberwachten Lernens dar. Einige Bereiche, in denen halbüberwachtes Lernen eingesetzt wird, sind:

  • Maschinelle Übersetzung. Lernen von Algorithmen zur Übersetzung von Sprache auf der Grundlage von weniger als einem vollständigen Wörterbuch.
  • Betrugserkennung. Erkennung von Betrugsfällen, wenn nur wenige positive Beispiele vorliegen.
  • Kennzeichnung von Daten. Algorithmen, die auf kleinen Datensätzen trainiert wurden, können lernen, Datenetiketten automatisch auf größere Datensätze anzuwenden.

Wie funktioniert Reinforcement Learning

Reinforcement Learning funktioniert, indem ein Algorithmus mit einem bestimmten Ziel und einem vorgeschriebenen Satz von Regeln zur Erreichung dieses Ziels programmiert wird. Datenwissenschaftler programmieren den Algorithmus auch so, dass er nach positiven Belohnungen sucht – die er erhält, wenn er eine Aktion ausführt, die dem Endziel förderlich ist – und Bestrafungen vermeidet – die er erhält, wenn er eine Aktion ausführt, die ihn weiter von seinem Endziel entfernt. Verstärkungslernen wird häufig in folgenden Bereichen eingesetzt:

  • Robotik. Roboter können mit dieser Technik lernen, Aufgaben in der physischen Welt auszuführen.
  • Videospiele. Verstärkungslernen wurde eingesetzt, um Bots das Spielen einer Reihe von Videospielen beizubringen.
  • Ressourcenmanagement. Angesichts endlicher Ressourcen und eines definierten Ziels kann das Verstärkungslernen Unternehmen bei der Planung der Ressourcenzuweisung helfen.
Maschinelles Lernen ist wie Statistik auf Steroiden.

Anwendungen des maschinellen Lernens

Heute wird das maschinelle Lernen in einem breiten Spektrum von Anwendungen eingesetzt. Eines der bekanntesten Beispiele für maschinelles Lernen in der Praxis ist die Empfehlungsmaschine, die den News Feed von Facebook antreibt.

Facebook nutzt maschinelles Lernen, um die Anzeige des Feeds jedes Mitglieds zu personalisieren. Wenn ein Mitglied häufig aufhört, die Beiträge einer bestimmten Gruppe zu lesen, zeigt die Empfehlungsmaschine die Aktivitäten dieser Gruppe früher im Feed an.

Hinter den Kulissen versucht die Maschine, bekannte Muster im Online-Verhalten des Mitglieds zu verstärken. Sollte das Mitglied seine Verhaltensmuster ändern und in den kommenden Wochen keine Beiträge aus dieser Gruppe lesen, wird der News Feed entsprechend angepasst.

Neben Empfehlungsmaschinen wird maschinelles Lernen auch in folgenden Bereichen eingesetzt:

Kundenbeziehungsmanagement: CRM-Software kann maschinelle Lernmodelle verwenden, um E-Mails zu analysieren und die Mitglieder des Vertriebsteams aufzufordern, die wichtigsten Nachrichten zuerst zu beantworten. Fortschrittlichere Systeme können sogar potenziell wirksame Antworten empfehlen.

Business Intelligence – BI- und Analyseanbieter nutzen maschinelles Lernen in ihrer Software, um potenziell wichtige Datenpunkte, Muster von Datenpunkten und Anomalien zu identifizieren.

Personalinformationssysteme – HRIS-Systeme können maschinelle Lernmodelle nutzen, um Bewerbungen zu filtern und die besten Kandidaten für eine offene Stelle zu identifizieren.

Selbstfahrende Autos – Algorithmen des maschinellen Lernens können es sogar einem teilautonomen Auto ermöglichen, ein teilweise sichtbares Objekt zu erkennen und den Fahrer zu warnen.

Virtuelle Assistenten – Intelligente Assistenten kombinieren in der Regel überwachte und nicht überwachte Modelle des maschinellen Lernens, um natürliche Sprache zu interpretieren und Kontext zu liefern.

Vor- und Nachteile

Maschinelles Lernen hat leistungsstarke Anwendungsfälle gesehen, die von der Vorhersage des Kundenverhaltens bis zum Betriebssystem für selbstfahrende Autos reichen. Aber nur weil einige Branchen Vorteile gesehen haben, heißt das nicht, dass maschinelles Lernen ohne Nachteile ist.

Was die Vorteile angeht, kann maschinelles Lernen Unternehmen helfen, ihre Kunden auf einer tieferen Ebene zu verstehen. Durch das Sammeln von Kundendaten und deren Korrelation mit dem Verhalten im Laufe der Zeit können Algorithmen des maschinellen Lernens Assoziationen erlernen und den Teams dabei helfen, Produktentwicklungs- und Marketinginitiativen auf die Kundennachfrage abzustimmen.

Einige Internetunternehmen nutzen maschinelles Lernen als primären Treiber in ihren Geschäftsmodellen. Uber zum Beispiel nutzt Algorithmen, um Fahrer mit Fahrern zusammenzubringen. Google nutzt maschinelles Lernen, um bei Suchanfragen die richtigen Anzeigen zu schalten.

Aber maschinelles Lernen hat auch Nachteile. In erster Linie kann es teuer sein. Projekte zum maschinellen Lernen werden in der Regel von Datenwissenschaftlern durchgeführt, die hohe Gehälter beziehen. Diese Projekte erfordern auch eine Software-Infrastruktur, die sehr kostspielig sein kann.

Es gibt auch das Problem der Verzerrung durch maschinelles Lernen. Algorithmen, die auf Datensätzen trainiert wurden, die bestimmte Bevölkerungsgruppen ausschließen oder Fehler enthalten, können zu ungenauen Modellen der Welt führen, die im besten Fall versagen und im schlimmsten Fall diskriminierend sind. Wenn ein Unternehmen seine Kerngeschäftsprozesse auf voreingenommene Modelle stützt, kann dies zu regulatorischen und rufschädigenden Problemen führen.

Auswahl des richtigen maschinellen Lernmodells

Der Prozess der Auswahl des richtigen maschinellen Lernmodells zur Lösung eines Problems kann zeitaufwändig sein, wenn nicht strategisch vorgegangen wird.

Schritt 1: Bringen Sie das Problem mit den potenziellen Dateninputs in Einklang, die für die Lösung in Betracht gezogen werden sollten. Dieser Schritt erfordert die Hilfe von Datenwissenschaftlern und Experten, die ein tiefes Verständnis des Problems haben.

Schritt 2: Sammeln von Daten, Formatieren und Kennzeichnen der Daten, falls erforderlich. Dieser Schritt wird in der Regel von Datenwissenschaftlern mit Hilfe von Data Wranglern durchgeführt.

Schritt 3: Auswahl der zu verwendenden Algorithmen und Testen ihrer Leistungsfähigkeit. Dieser Schritt wird in der Regel von Datenwissenschaftlern durchgeführt.

Schritt 4: Weitere Feinabstimmung der Ergebnisse, bis sie ein akzeptables Maß an Genauigkeit erreichen. Dieser Schritt wird in der Regel von Datenwissenschaftlern mit dem Feedback von Experten durchgeführt, die ein tiefes Verständnis des Problems haben.

Bedeutung von menschlich interpretierbarem maschinellem Lernen

Zu erklären, wie ein bestimmtes ML-Modell funktioniert, kann eine Herausforderung sein, wenn das Modell komplex ist. Es gibt einige vertikale Branchen, in denen Datenwissenschaftler einfache maschinelle Lernmodelle verwenden müssen, weil es für das Unternehmen wichtig ist, zu erklären, wie jede einzelne Entscheidung getroffen wurde. Dies gilt vor allem für Branchen mit hohem Befolgungsaufwand wie Banken und Versicherungen.

Komplexe Modelle können genaue Vorhersagen treffen, aber einem Laien zu erklären, wie ein Ergebnis ermittelt wurde, kann schwierig sein.

Die Zukunft des maschinellen Lernens

Algorithmen des maschinellen Lernens gibt es zwar schon seit Jahrzehnten, sie haben jedoch mit der zunehmenden Bedeutung der künstlichen Intelligenz (KI) neue Popularität erlangt.

Die Plattformen für maschinelles Lernen gehören zu den am stärksten umkämpften Bereichen der Unternehmenstechnologie. Die meisten großen Anbieter, darunter Amazon, Google, Microsoft, IBM und andere, wetteifern darum, Kunden für Plattformdienste zu gewinnen, die das gesamte Spektrum der maschinellen Lernaktivitäten abdecken, einschließlich Datenerfassung, Datenaufbereitung, Datenklassifizierung, Modellerstellung, Training und Anwendungsbereitstellung.

Da maschinelles Lernen immer mehr an Bedeutung für den Geschäftsbetrieb gewinnt und KI in Unternehmen immer praktischer wird, werden sich die Kriege um die Plattformen für maschinelles Lernen nur noch verschärfen.

Deep Learning funktioniert ganz anders als traditionelles maschinelles Lernen.

Die kontinuierliche Forschung im Bereich Deep Learning und KI konzentriert sich zunehmend auf die Entwicklung allgemeinerer Anwendungen. Die heutigen KI-Modelle erfordern umfangreiches Training, um einen Algorithmus zu entwickeln, der für eine bestimmte Aufgabe optimiert ist. Einige Forscher erforschen jedoch Möglichkeiten, Modelle flexibler zu gestalten, und suchen nach Techniken, die es einer Maschine ermöglichen, den bei einer Aufgabe gelernten Kontext auf zukünftige, andere Aufgaben anzuwenden.

Geschichte des maschinellen Lernens

1642 – Blaise Pascal erfindet eine mechanische Maschine, die addieren, subtrahieren, multiplizieren und dividieren kann.

1679 – Gottfried Wilhelm Leibniz entwickelt das System des Binärcodes.

1834 – Charles Babbage hat die Idee für ein allgemeines Allzweckgerät, das mit Lochkarten programmiert werden kann.

1842 – Ada Lovelace beschreibt eine Abfolge von Operationen zur Lösung mathematischer Probleme mit Hilfe von Charles Babbages theoretischer Lochkartenmaschine und wird die erste Programmiererin.

1847 – George Boole erfindet die Boolesche Logik, eine Form der Algebra, in der alle Werte auf die binären Werte wahr oder falsch reduziert werden können.

1936 – Der englische Logiker und Kryptoanalytiker Alan Turing schlägt eine universelle Maschine vor, die eine Reihe von Anweisungen entschlüsseln und ausführen kann. Sein veröffentlichter Beweis gilt als Grundlage der Informatik.

1952 – Arthur Samuel entwickelt ein Programm, das einem IBM-Computer hilft, beim Damespiel besser zu werden, je öfter er spielt.

1959 – MADALINE wird das erste künstliche neuronale Netzwerk, das auf ein reales Problem angewandt wird: die Entfernung von Echos aus Telefonleitungen.

1985 – Terry Sejnowskis und Charles Rosenbergs künstliches neuronales Netzwerk brachte sich selbst bei, 20.000 Wörter in einer Woche richtig auszusprechen.

1997 – IBMs Deep Blue besiegte den Schachgroßmeister Garry Kasparov.

1999 – Ein intelligenter CAD-Prototyp überprüfte 22.000 Mammogramme und erkannte Krebs 52 % genauer als Radiologen.

2006 – Der Informatiker Geoffrey Hinton erfindet den Begriff „Deep Learning“, um die Forschung an neuronalen Netzen zu beschreiben.

2012 – Ein von Google entwickeltes unüberwachtes neuronales Netz lernt, Katzen in YouTube-Videos mit einer Genauigkeit von 74,8 % zu erkennen.

2014 – Ein Chatbot besteht den Turing-Test, indem er 33 % der menschlichen Richter davon überzeugt, dass er ein ukrainischer Teenager namens Eugene Goostman ist.

2014 – Google’s AlphaGo defeats the human champion in Go, the most difficult board game in the world.

2016 – LipNet, DeepMind’s artificial-intelligence system, identifies lip-read words in video with an accuracy of 93.4%.

2019 – Amazon controls 70% of the market share for virtual assistants in the U.S.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.