Hoe werkt Chat GPT?

De superslimme alleskunner Chat GPT lijkt uit de lucht te zijn gevallen. Veel marketeers zijn lovend over de AI-tool. Maar kan Chat GPT echt alles? Zelden lees ik hoe Chat GPT werkt en tot zijn antwoorden komt. Om AI goed op waarde te schatten, wil ik in hoofdlijnen weten hoe het werkt. Het werd een uitdagende en interessante zoektocht.

Laat ik meteen met de deur in huis vallen: artificial intelligence (AI) is niet intelligent. Het heeft geen bewustzijn, geen idee hoe de wereld om zich heen werkt en geen opinie en geen ziel. Eigenlijk is het algoritme vrij dom en leunt zwaar op statistiek, wiskunde en een aantal slimme concepten. Laat je niet misleiden door de schijnbare menselijke dialoog die letterlijk voor je ogen wordt ‘getypt’. Dit alles maakt de AI-tool zeker niet onbruikbaar, het komt vooral tot zijn recht binnen een goede samenwerking met een menselijk brein.

Wat is Chat GPT?

Chat GPT is een Large Language Models (LLM), momenteel bekend als GPT-4. GPT staat voor Generative Pretrained Tranformer; het AI-model genereert antwoorden, is getraind door mensen en transformeert input tot output. Daarnaast is het belangrijk te weten dat het algoritme zelflerend en -creëren is. Het ontwikkeld zichzelf gaandeweg en is in staat nieuwe content te ontwikkelen.

GPT-4 is een zogenaamd neural network, een methode binnen machine learning die vooral geschikt is voor de wat meer complexere taken zoals beeld- geluid- en taalherkenning. een neuraal netwerk in AI is gebaseerd op het neurale netwerk binnen het menselijk brein, maar dan veel minder complex. Het algoritme is getraind op basis van verschillende layers en lijkt hierdoor op de manier waarop we denken dat het menselijk brein werkt.

Training van een neuraal netwerk

Een neuraal netwerk kan van zichzelf niets. Het moet uitvoerig getraind worden op (tot nu toe) één specifieke taak. AI is ook niet nieuw. Sinds de jaren ‘50 dromen we over AI. In de afgelopen jaren is er ook niet zo veel veranderd aan het concept van AI. Waarom dan nu weer een stap voorwaarts? De hardwaresnelheid en beschikbaarheid van grote hoeveelheden digitale data hebben een voor AI acceptabel niveau bereik. Chat GPT dankt zijn kunde aan de training op basis van een enorme hoeveelheid data uit boeken, wikipedia-nieuwsartikelen, wetenschappelijke tijdschriften en andere digitale bronnen. Dit trainingsmodel is gebaseerd op supervised learning en reinforced learning, twee belangrijke componenten van moderne machine learning. 

Hoe werkt het trainen van een AI-model? Laat ik de werking van Chat GPT eenvoudig proberen uit te leggen. Laten we zeggen dat ik een heel eenvoudige vraag stel:

Ik: Vertel in twee zinnen wat de invloed van Chat GPT op marketing is?

Chat GPT: Chat GPT heeft de marketing beïnvloed door geautomatiseerde klantenservice en ondersteuning te bieden, en door gepersonaliseerde marketingberichten en content te genereren, waardoor betere klantinteracties en efficiëntere marketingprocessen mogelijk worden.

Best een goed antwoord! Maar hoe komt Chat GPT aan een antwoord? Daar is best veel werk voor verzet. Wat het algoritme in essentie doet is het voorspellen welke woorden, woordgroepen en zinnen worden geassocieerd met de input, en deze verwerken tot een antwoord.

Het kijkt niet enkel naar de woorden in de vraag, maar kijkt ook naar associaties. Het algoritme kan gerelateerde woorden bepalen op basis van woordvectoren, een techniek waarbij de relatie tussen woorden is vastgesteld in een dimensionale ruimte. Het voorbeeld in het plaatje is een zeer vereenvoudigde weergave over slechts drie dimensies. Zo zal het woord ‘marketing’ in de ruimte dicht in de buurt liggen van woorden als ‘seo’ en ‘marketeer’, verder weg liggen van woorden als ‘sales’ en ‘verkoper’ en nog verder weg liggen van het woord ‘vacature’. Op basis van een woordvector kan het algoritme verbanden (afstanden) leggen tussen verschillende woorden. Als het algoritme de vector marketing → marketeer weet, kan de relatie verkoop → verkoper hieruit worden afgeleid.

Vervolgens kijkt het algoritme welke woorden, woordgroepen en zinnen in teksten met deze woorden geassocieerd worden, op basis van de data waarop getraind is. Tenslotte gooit het algoritme nog wat randomness door de geselecteerde woorden, zodat het de volgende keer met een iets ander antwoord komt.

Eenvoudig samengevat:

term ‘Chat GPT’ → relatie met ‘AI’ → in trainingsteksten samen met het woord 'beïnvloeding' vaak in de buurt van ‘geautomatiseerde klantenservice’.

Als Chat GPT bepaald heeft wat de belangrijkste woorden zijn die samenhangen met mijn vraag, probeert het een antwoord woord voor woord samen te stellen. Bij het samenstellen van een antwoord voorspelt het algoritme op basis van voorgaande woorden wat de meest logische vervolgwoorden zijn om tot een goed, grammaticaal kloppend antwoord te komen. Training op basis van een groot aantal teksten heeft het algoritme inzicht gegeven hoe natuurlijke taal is samengestel. Het lijkt een klein beetje op de voorspellende tekst op je telefoon, maar is uiteraard een heel stuk ingewikkelder. 

Hoe bouwt Chat GPT antwoorden in zinnen?

Stel we geven Chat GPT het begin van een vraag:

Marketing automation is

Chat GPT berekent op basis van alle woorden van het antwoord welke woorden een logisch vervolg kunnen zijn. Het kijkt hiervoor niet letterlijk naar de voorgaande woorden maar naar overeenkomsten in context en betekenis, zoals ik eerder heb laten zien. Het eindresultaat is een lijst van mogelijke reacties, voorzien van de waarschijnlijkheid dat dit een goed antwoord is.

  • Marketing automation is een 4.5%
  • Marketing automation is gebaseerd 3.8%
  • Marketing automation is normaliter 2.1%
  • Marketing automation is veelal 0.9%

Het model bepaalt nu wat de meest logische keuze is voor het volgende woord, gebaseerd op de voorgaande tekst. In het voorbeeld hierboven voegt het ‘een’ toe aan het antwoord. Vervolgens herhaalt het algoritme de voorgaande zetten, tot het antwoord compleet is. Er is een stopmechanisme in het model ingebouwd op basis de gemiddelde lengte van het soort tekst. 

Training van Chat GPT

Nu zou je misschien verwachten dat het algoritme altijd het beste vervolgwoord kiest. Maar dat zou veel dezelfde teksten opleveren. Door ook hier wat randomness toe te voegen, worden antwoorden al snel compleet verschillend. We noemen dit creativiteit. Soms slaat het algoritme de plank mis in de keuze van passende woorden en ontstaat er een goedlopend verhaal waar geen touw aan vast te knopen is. We noemen dit ‘hallucineren’, maar je zou het ook liegen of een zenuwinzinking kunnen noemen.

Zoals je je misschien kunt voorstellen, is dit zinsvoltooiingsmodel niet genoeg. Als we het bijvoorbeeld vragen om uit te leggen hoe marketing automation werkt, moet het een andere strategie gebruiken. Hier komt training om de hoek kijken. 

Machine learning training fase 1

In de eerste fase van het trainingsproces spelen mensen de rol van zowel de gebruiker als van de ideale chatbot. Elke trainingexercitie bestaat uit een menselijke gebruiker en een persoon die als chatbot fungeert. Zij voeren samen een gesprek. Het doel hiervan is om de AI te trainen op een menselijk gesprek. De chats met echte mensen worden in het model ingevoerd en op deze manier leert het model de waarschijnlijkheid in keuze en de volgorde van woorden, woordgroepen en zinnen binnen een gesprek. Door deze supervised learning leert het algoritme een output te genereren die meer is dan alleen goed afgeronde zin. Het leert patronen over de context en betekenis van verschillende inputs zodat Chat GPT op de juiste manier reageert.

Machine learning training fase 2

Maar ook dit is niet het einde van het trainingsproces. De uitvoer van deze status wordt verder verfijnd in een tweede fase waarin de trainers een ​​beloning of rangschikking aan elk gegenereerd antwoord toewijzen. Chat GTP is geprogrammeerd om te optimaliseren voor een zo hoog mogelijke beloning. De trainer kan het model bijvoorbeeld iets vragen als:

Beschrijf marketing automation

in drie antwoorden. De trainer kent vervolgens een waarde toe aan de antwoorden.

  1. Marketing automation is het gebruik van software en technologie om marketingprocessen te automatiseren, zoals lead nurturing, e-mailmarketing en sociale media, met als doel efficiëntie te verhogen en gepersonaliseerde communicatie te leveren.
  2. Marketing automation is het gebruik van software en technologieën om marketingprocessen te automatiseren en te stroomlijnen, waaronder leadgeneratie, klantsegmentatie, e-mailmarketing en campagnetracking.
  3. Marketing automation is het gebruik van software en technologie om marketingprocessen te automatiseren, zoals het genereren, beheren en analyseren van leads, het leveren van gepersonaliseerde content en het automatiseren van campagnes.

De ranking wordt als feedback teruggegeven aan het algoritme als bijvoorbeeld A > C > B, waardoor het systeem verder leert over wenselijke antwoorden. 

Machine learning training fase 3

Het probleem met het uitsluitend gebruiken van menselijke trainers, zoals bij supervised learning, is de schaal. Menselijke trainers zouden moeten anticiperen op alle invoer in uitvoer van elke mogelijke vraag die een gebruiker op elk moment zou kunnen stellen. Dit is onmogelijk. Hiervoor gebruikt het een derde stap die reinforced learning wordt genoemd. Het model wordt getraind om de onderliggende context en patronen in gegevens te leren op basis van de eerdere, door mensen aangeleerde feedback. Met andere woorden, het model gebruikt de pre-training, inclusief het classificatiesysteem om de basis te vormen van de output voor de unsupervised training. Omdat dit een volledig digitaal proces is, kan het algoritme enorme hoeveelheden gegevens uit verschillende bronnen in korte tijd verwerken. Het kan dus de training van het menselijke type opschalen naar een veel grotere dataset. En die dataset wordt gebruikt om Chat GPT te trainen. De database van GPT-3.5 is enorm, ongeveer 45 terabyte aan data. Dit klinkt misschien als weinig naar de huidige maatstaven, maar bedenk je dat je op elke terabyte ruim 80 miljoen pagina's aan informatie kunt opslaan.

Conclusie van Chat GPT

Chat GPT is een chatbot die werkt op basis van artificial intelligence. De resultaten zijn zonder meer indrukwekkend en een goede hulp bij de dagelijkse werkzaamheden van een marketeer. Maar er is -zoals altijd- een keerzijde. Ik denk dat het belangrijk is om je te realiseren dat het AI-model voorspellingen en patronen uit het verleden gebruikt om tot een mensachtige reactie te komen, maar dat het nog steeds een dom algoritme is dat doet wat het geleerd heeft. En dat zorgt voor beperkingen.

  • Chat GPT heeft beperkte contextuele kennis. Het analyseert woorden en woordgroepen en zoekt overeenkomsten. Chat GPT kan niet redeneren. In sommige gevallen worden verkeerde verbanden gelegd en genereert dit onjuiste of misleidende informatie. Sterk opvallen fouten zijn tot daar aan toe, maar kleine foutjes vallen minder goed op door de overtuiging waarmee Chat GPT spreekt. Je hebt geen inzicht in de bron van de informatie.
  • Chat GPT kan niet alles. ‘Wat zijn de belangrijkste SEO termen voor markethings.blog?’ levert een werkelijk belabberde lijst met termen op. Ook ‘Schrijf een pakkende titel voor [URL]’ levert zeer wisselende resultaten op. Marketing is geen wiskunde en het is daarom soms lastig te achterhalen of antwoorden ook echt juist zijn. (NB een keyword-analyse op basis van je eigen content is natuurlijk bij voorbaat al een valkuil).
  • Het gebruiksgemak waarmee Chat GPT hele blogs gratis uitpoept zorgt waarschijnlijk voor een explosieve stijging aan informatie. Ik word nu al helemaal gek van de whitepapers met ‘de 150 beste Chat GPT prompts’. Chat GPT herkauwt de informatie die het kent. Nieuwe ideeën of inzichten kan het niet reproduceren. Zijn wij mensen gebaat bij meer van hetzelfde? Het maken van onderscheidende content met een mening en een visie blijft mensenwerk.
  • Chat GPT maakt marketeers lui. AI helpt mij om een basis of een structuur neer te zetten. Maar ik ben zelf nog een hele poos bezig om mijn tone of voice, visie en ideeën erin te verwerken. Die tijd moet je nog steeds nemen! Ik merk bij mezelf dat dit soms een uitdaging is. Ik moet oppassen dat Chat GPT mij niet gemakzuchtig maakt. Misschien geldt dit ook voor jou?
  • Beperkte controle over de output. Hierdoor heb je mogelijk minder controle over de exacte uitvoer van het model, waardoor het moeilijk kan zijn om consistentie en merkintegriteit te handhaven. Chat GPT leert (nog niet) wat mijn persoonlijke (communicatie-) voorkeuren zijn.
  • Chat GPT doet wat ik vraagt, niet wat ik wil. Op de vraag: wat is de beste oplossing voor de milieuproblematiek, zou het antwoord best weleens kunnen zijn: de mens uitroeien. Ok, ik overdrijf misschien een beetje maar onthoud dat Chat GPT precies doet wat je wenst, niet wat je wil. Je wilt denk ik ook van een marketing agency dat zij doen wat je wenst, niet wat je wil 😉

Bronnen

Leave a reply