Maskinlärning (ML) är en typ av artificiell intelligens (AI) som gör det möjligt för mjukvarutillämpningar att bli mer exakta när det gäller att förutsäga resultat utan att vara uttryckligen programmerade att göra det. Algoritmer för maskininlärning använder historiska data som indata för att förutsäga nya utdata.
Rekommendationsmotorer är ett vanligt användningsområde för maskininlärning. Andra populära användningsområden är bedrägeriupptäckt, skräppostfiltrering, upptäckt av hot från skadlig kod, automatisering av affärsprocesser (BPA) och förutsägbart underhåll.
- Typer av maskininlärning
- Hur övervakad maskininlärning fungerar
- Hur oövervakad maskininlärning fungerar
- Hur semisuperviserad inlärning fungerar
- Hur förstärkningsinlärning fungerar
- Användningsområden för maskininlärning
- Fördelar och nackdelar
- Välja rätt maskininlärningsmodell
- Värdet av mänskligt tolkningsbar maskininlärning
- Framtiden för maskininlärning
- Maskinininlärningens historia
Typer av maskininlärning
Klassisk maskininlärning kategoriseras ofta efter hur en algoritm lär sig att bli mer exakt i sina förutsägelser. Det finns fyra grundläggande metoder: övervakad inlärning, oövervakad inlärning, halvövervakad inlärning och förstärkningsinlärning. Vilken typ av algoritm en datavetare väljer att använda beror på vilken typ av data de vill förutsäga.
- Övervakad inlärning. I denna typ av maskininlärning förser datavetare algoritmerna med märkta träningsdata och definierar de variabler de vill att algoritmen ska bedöma om det finns korrelationer. Både algoritmens input och output specificeras.
- Oövervakad inlärning. Denna typ av maskininlärning omfattar algoritmer som tränar på omärkta data. Algoritmen skannar igenom datamängder och letar efter meningsfulla samband. Både de data som algoritmerna tränar på och de förutsägelser eller rekommendationer som de ger ut är förutbestämda.
- Semi-supervised learning. Detta tillvägagångssätt för maskininlärning innebär en blandning av de två föregående typerna. Dataforskare kan mata en algoritm med mestadels märkta träningsdata, men modellen är fri att utforska data på egen hand och utveckla sin egen förståelse av datamängden.
- Förstärkningsinlärning. Förstärkningsinlärning används vanligtvis för att lära en maskin att slutföra en process i flera steg för vilken det finns klart definierade regler. Datavetare programmerar en algoritm för att slutföra en uppgift och ger den positiva eller negativa signaler när den tar reda på hur den ska slutföra en uppgift. Men för det mesta bestämmer algoritmen själv vilka steg den ska ta på vägen.
Hur övervakad maskininlärning fungerar
För övervakad maskininlärning krävs att datavetenskapsmannen tränar algoritmen med både märkta indata och önskade utdata. Övervakade inlärningsalgoritmer är bra för följande uppgifter:
- Binär klassificering. Indelning av data i två kategorier.
- Klassificering i flera klasser. Välja mellan mer än två typer av svar.
- Regressionsmodellering. Förutsägelse av kontinuerliga värden.
- Ensembling. Kombinera förutsägelserna från flera maskininlärningsmodeller för att få fram en korrekt förutsägelse.
Hur oövervakad maskininlärning fungerar
Omedelbara maskininlärningsalgoritmer kräver inte att data är märkta. De sållar igenom omärkta data för att leta efter mönster som kan användas för att gruppera datapunkter i delmängder. De flesta typer av djupinlärning, inklusive neurala nätverk, är oövervakade algoritmer. Algoritmer för oövervakad inlärning är bra för följande uppgifter:
- Klustring. Dela upp datamängden i grupper baserat på likhet.
- Upptäckt av anomalier. Identifierar ovanliga datapunkter i en datamängd.
- Association mining. Identifiering av uppsättningar av punkter i en datamängd som ofta förekommer tillsammans.
- Dimensionality Reduction. Minskar antalet variabler i en datamängd.
Hur semisuperviserad inlärning fungerar
Semisuperviserad inlärning fungerar genom att datavetare matar en liten mängd märkta träningsdata till en algoritm. Från detta lär sig algoritmen datamängdens dimensioner, som den sedan kan tillämpa på nya, omärkta data. Algoritmernas prestanda förbättras vanligtvis när de tränas på märkta datamängder. Men det kan vara tidskrävande och dyrt att märka data. Semi-övervakad inlärning är en medelväg mellan prestanda för övervakad inlärning och effektivitet för oövervakad inlärning. Några områden där semiövervakad inlärning används är:
- Maskinöversättning. Inlärning av algoritmer för att översätta språk baserat på mindre än en fullständig ordlista.
- Upptäckt av bedrägerier. Identifiera fall av bedrägeri när man bara har några få positiva exempel.
- Märkning av data. Algoritmer som tränas på små datamängder kan lära sig att tillämpa datamärkning på större mängder automatiskt.
Hur förstärkningsinlärning fungerar
Förstärkningsinlärning fungerar genom att programmera en algoritm med ett distinkt mål och en föreskriven uppsättning regler för att uppnå det målet. Datavetare programmerar också algoritmen så att den söker efter positiva belöningar – som den får när den utför en handling som gynnar det slutliga målet – och undviker bestraffningar – som den får när den utför en handling som leder till att den kommer längre bort från det slutliga målet. Reinforcement learning används ofta inom områden som:
- Robotik. Robotar kan lära sig att utföra uppgifter i den fysiska världen med hjälp av denna teknik.
- Videospel. Reinforcement learning har använts för att lära robotar att spela ett antal videospel.
- Resurshantering. Med ändliga resurser och ett definierat mål kan förstärkningsinlärning hjälpa företag att planera hur resurserna ska fördelas.
Användningsområden för maskininlärning
I dag används maskininlärning i många olika tillämpningar. Ett av de kanske mest kända exemplen på maskininlärning i praktiken är den rekommendationsmotor som driver Facebooks nyhetsflöde.
Facebook använder maskininlärning för att anpassa hur varje medlems flöde levereras. Om en medlem ofta stannar upp för att läsa en viss grupps inlägg kommer rekommendationsmotorn att börja visa mer av den gruppens aktivitet tidigare i flödet.
Här bakom kulisserna försöker motorn förstärka kända mönster i medlemmens beteende på nätet. Om medlemmen ändrar mönster och inte läser inlägg från den gruppen under de kommande veckorna kommer nyhetsflödet att justeras i enlighet med detta.
Förutom rekommendationsmotorer finns det andra användningsområden för maskininlärning, bland annat följande:
Hantering av kundrelationer – CRM-programvara kan använda modeller för maskininlärning för att analysera e-post och uppmana säljare att svara på de viktigaste meddelandena först. Mer avancerade system kan till och med rekommendera potentiellt effektiva svar.
Business intelligence — BI- och analysleverantörer använder maskininlärning i sin programvara för att identifiera potentiellt viktiga datapunkter, mönster av datapunkter och anomalier.
Informationssystem för mänskliga resurser — HRIS-system kan använda modeller för maskininlärning för att filtrera igenom ansökningar och identifiera de bästa kandidaterna för en ledig tjänst.
Självkörande bilar — Algoritmer för maskininlärning kan till och med göra det möjligt för en halvautonom bil att känna igen ett delvis synligt objekt och varna föraren.
Virtuella assistenter — Smarta assistenter kombinerar vanligen övervakade och icke övervakade modeller för maskininlärning för att tolka naturligt tal och förse kontexten med information.
Fördelar och nackdelar
Maskinininlärning har fått kraftfulla användningsområden, från att förutsäga kundbeteenden som utgör operativsystemet för självkörande bilar. Men bara för att vissa branscher har sett fördelar betyder det inte att maskininlärning är utan nackdelar.
När det gäller fördelar kan maskininlärning hjälpa företag att förstå sina kunder på en djupare nivå. Genom att samla in kunddata och korrelera den med beteenden över tid kan algoritmer för maskininlärning lära sig associationer och hjälpa team att skräddarsy produktutveckling och marknadsföringsinitiativ efter kundernas efterfrågan.
Vissa internetföretag använder maskininlärning som en primär drivkraft i sina affärsmodeller. Uber använder till exempel algoritmer för att matcha förare och passagerare. Google använder maskininlärning för att få upp rätt annonser i sökningar.
Men maskininlärning har nackdelar. Först och främst kan det vara dyrt. Maskininlärningsprojekt drivs vanligtvis av datavetare, som har höga löner. Dessa projekt kräver också mjukvaruinfrastruktur som kan vara dyrt.
Det finns också problemet med fördomar vid maskininlärning. Algoritmer som tränats på datamängder som utesluter vissa populationer eller innehåller fel kan leda till felaktiga modeller av världen som i bästa fall misslyckas och i värsta fall är diskriminerande. När ett företag baserar centrala affärsprocesser på fördomsfulla modeller kan det stöta på skador på regelverk och rykte.
Välja rätt maskininlärningsmodell
Processen att välja rätt maskininlärningsmodell för att lösa ett problem kan vara tidskrävande om den inte hanteras strategiskt.
Steg 1: Anpassa problemet till potentiella datainputs som bör övervägas för lösningen. Detta steg kräver hjälp från datavetare och experter som har en djup förståelse för problemet.
Steg 2: Samla in data, formatera dem och märka dem vid behov. Detta steg leds vanligtvis av datavetare, med hjälp av dataväxlare.
Steg 3: Välj vilken eller vilka algoritmer som ska användas och testa för att se hur väl de fungerar. Detta steg utförs vanligtvis av datavetare.
Steg 4: Fortsätt att finjustera resultaten tills de når en acceptabel noggrannhetsnivå. Detta steg utförs vanligtvis av datavetare med feedback från experter som har en djup förståelse för problemet.
Värdet av mänskligt tolkningsbar maskininlärning
Förklara hur en specifik ML-modell fungerar kan vara en utmaning när modellen är komplex. Det finns vissa vertikala branscher där datavetare måste använda enkla modeller för maskininlärning eftersom det är viktigt för verksamheten att förklara hur varje enskilt beslut fattades. Detta gäller särskilt i branscher med tunga krav på efterlevnad som bank- och försäkringsbranschen.
Komplexa modeller kan ge exakta förutsägelser, men det kan vara svårt att förklara för en lekman hur ett resultat bestämdes.
Framtiden för maskininlärning
Algoritmer för maskininlärning har funnits i årtionden, men de har fått ny popularitet i takt med att artificiell intelligens (AI) har blivit alltmer framträdande. Särskilt modeller för djupinlärning driver dagens mest avancerade AI-tillämpningar.
Plattformar för maskininlärning är ett av de mest konkurrensutsatta områdena inom företagstekniken, och de flesta stora leverantörerna, däribland Amazon, Google, Microsoft, IBM och andra, tävlar om att teckna avtal med kunderna om plattformstjänster som täcker hela spektrumet av maskininlärningsaktiviteter, inklusive datainsamling, dataförberedelse, dataklassificering, modellbyggande, utbildning och driftsättning av tillämpningar.
I takt med att maskininlärning fortsätter att öka i betydelse för affärsverksamheten och AI blir allt mer praktiskt användbart i företagsmiljöer kommer plattformskriget för maskininlärning bara att intensifieras.