Trainingsmodellen voor Artificial Intelligence

Artificial Intelligence (AI) is niet één systeem, maar een verzamelnaam voor verschillende vormen en benaderingen om een machine menselijk denkgedrag te laten vertonen. Voor een AI een taak kan uitvoeren, moet deze getraind worden. In dit blog geeft ik een kort overzicht van de belangrijkste trainingsvormen voor AI.

Rule-based AI

Grofweg kun je Artificial Intelligence verdelen in twee soorten trainingsvormen: rule-based AI en neurale netwerken. Rule-based AI is een traditionele benadering waarbij een systeem is geprogrammeerd met specifieke regels en logica om een taak uit te voeren. Het systeem selecteert en manipuleert hierbij data op basis van vooraf gedefinieerde regels en if/then-beslissingen. We kunnen een hele discussie voeren of AI überhaupt intelligent is, maar rule-based AI is het zeker niet: het is een brute force-tactiek.

Deep Blue

Een voorbeeld van rule-based AI training is IBM's Deep Blue-schaakcomputer die wereldkampioen Garry Kasparov versloeg in 1997. In Deep Blue zijn de schaakregels en een aantal bekende strategiëen hard gecodeerd. De software rekent per bord alle mogelijke zetten die leiden tot een overwinning uit. Op basis hiervan doet de software de zet die de meeste kans op een overwinning geeft. Deep Blue won de wedstrijd overigens nipt omdat een mens de rekenkracht niet heeft continu alle zetten uit te rekenen. Het winnen van een potje Go is voor rule-based AI een te grote uitdaging vanwege de vele mogelijke zetten en strategische aspecten van het spel.

Rule-based AI in marketing

Binnen marketing kun je bij rule-based AI denken aan een segmentatie-script of een campagne flow die op basis van gedrag of persoonskenmerken bepaalde keuzes maakt. Echter, ik denk dat weinig marketeers een marketingflow AI noemen… 

Machine Learning

Machine Learning is een trainingsvorm binnen artificial intelligence waarbij een automatisch systeem leert en zichzelf verbetert door middel van data en ervaring. Algoritmen zoeken naar patronen en inzichten in een zeer grote set data.

Hiervoor maakt machine learning gebruik van een neuraal netwerk. In tegenstelling tot rule-based AI liggen er geen regels vast. Op basis van de trainingsdata ‘tuned’ het algoritme zichzelf om tot een zo goed mogelijk resultaat te komen. Een AI-model worden getraind voor een specifiek doel, bijvoorbeeld het herkennen van een kat op een foto. Eenmaal getraind, voorspelt het model met hoeveel procent kans er een kat op een foto staat. De threshold bepaalt vervolgens of het antwoord daadwerkelijk ‘kat’ is. De uitkomst is dus een percentage en zelden een 100% score. In tegenstelling tot voor het menselijk brein, zijn voor het trainen van AI zeer grote sets data nodig en zijn de berekeningen zeer complex.

Neurale netwerken

Neurale netwerken zijn computernetwerken geïnspireerd op de structuur en werking van het menselijk brein. Ze bestaan uit lagen van kunstmatige neuronen die samenwerken om patronen te herkennen. De input layer verwerkt de input tot cijfers. Een of meerdere hidden layers zorgen voor de verwerking. En de output layer geeft tenslotte het resultaat. Hierdoor kunnen neurale netwerken complexe taken uitvoeren zoals beeldherkenning, natuurlijke taalverwerking en spraakherkenning.

Neuraal netwerk in marketing

Een neurale netwerk kan in marketing gebruikt worden voor statistische acties als voorspellen van klantgedrag, selecteren van look-alikes, het personaliseren van aanbiedingen en het bepalen van een ideale contentvolgorde. Of voor generatieve acties als het communiceren met klanten via chat of het schrijven van content of ads.

3 vormen van machine learning

We kennen drie soorten machine learning: Supervised Learning, Unsupervised Learning, Reinforcement Learning. Deze manieren van leren kunnen door de computer volledig automatisch worden gedaan. In sommige gevallen eindigt het leerproces met een laatste tuning door mensen. Bijvoorbeeld Chat GPT is in de laatste fase door mensen getraind in het zo menselijk mogelijk antwoord geven.

Supervised Learning

Bij supervised learning leert het algoritme van gelabelde voorbeelden om een bepaalde taak uit te voeren, bijvoorbeeld het herkennen van een kat op een foto. De trainingset bestaat uit zo'n 100.000 foto’s van katten met het label ‘kat’ (bijvoorbeeld van Flickr). Het algoritme weet dus van iedere afbeelding dat dit een kat is en probeert nu patronen te identificeren die een kat tot een kat maken en deze worden opgeslagen in het algoritme. Denk aan kleur, lijnen, vormen, structuur, etc.

Vervolgens wordt het algoritme getest op basis van een set ongelabelde afbeeldingen (testset). Het algoritme zal zichzelf bijsturen op basis van een juiste of onjuiste voorspelling. Zodra een algoritme een voldoende hoog percentage juiste uitkomsten geeft, kan het in gebruik worden genomen. Zo niet, dan is verdere training vereist. 

Het nadeel van superviced learning is dat deze trainingsmethode veel menselijke arbeid (tijd en geld) vereist en dat het model nooit beter zal worden dan de menselijke trainer.

Unsupervised Learning

Bij unsupervised learning leert het algoritme van ongelabelde gegevens en identificeert zelf natuurlijke clusters, patronen of verborgen structuren in de gegevens. Denk bijvoorbeeld aan het indelen van klanten in groepen. Op basis van een grote hoeveelheid historische klantdata bepaalt het algoritme wat belangrijke eigenschappen of randvoorwaarden zijn voor iemand om klant te worden. Vaak zijn de resultaten wat minder voor de hand liggend, puur omdat de data te complex voor mensen is.

Het nadeel van unsuperviced learning is de beperkte grip die we hebben op de uitkomst omdat het proces te complex is om te herleiden. Zit er in de dataset een information bias, waarbij de data ongewild gekleurd is, dan zal het model dit meenemen. Een bekend voorbeeld is een Amerikaans AI-model dat de rechtspraak moet ondersteunen door het geven van adviezen over de hoogte van straffen. Het model werd getraind op vonnissen uit het verleden en adviseerde zoals het dat geleerd had uit het verleden voor veroordeelden met een imigratie-achtergrond een hogere straf.

Reinforcement Learning

Bij reinforced learning krijgt het algoritme een doel en leert door (random) interactie met een omgeving dit doel te behalen. Het ontvangt telkens feedback in de vorm van een beloning of straf. Het algoritme start met een random actie die zeker in het begin voor ons mensen nergens op slaat. Na iedere handeling wordt het resultaat geanalyseerd en optimaliseert het algoritme zichzelf. Vervolgens doet het algoritme een nieuwe poging. Net zo lang tot een optimaal eindresultaat bereikt is.

Zo kun je AI bijvoorbeeld geheel zelfstandig leren om Pong te spelen of een auto over een circuit te laten rijden. Het algoritme begint zeer knullig, maar wordt steeds beter in het uitvoeren van de betreffende taak.Binnen een marketingcampagne kun je op deze manier de volgorde van uitingen laten bepalen voor een optimaal verkoopresultaat.

Het nadeel van reinforced learning is dat het slechts toepasbaar is op relatief eenvoudige taken. Zo kan reinforced learning prima op basis van random acties Pong leren spelen, maar in Donkey Kong is op basis van random acties geen overwinning te behalen. De game is te complex. Laat staan dat we een robot kunnen leren een glas bier in te schenken. Niet de techniek, maar de mogelijkheden binnen de software zijn simpelweg te groot.

Het mag duidelijk zijn dat de leermethode die je kiest, afhankelijk is van het gewenste resultaat. AI is gebaseerd op het menselijk brein, maar benadert in geen velden of wegen de complexiteit ervan. Artificial intelligence is dan ook niet intelligent en heeft vele pogingen van trial & error en hulp van mensen nodig om tot een goed resultaat te komen. Terwijl een peuter al na een contact met een kat, katten kan herkennen.

Leave a reply