Welkom, als klant geniet je hopelijk al met volle teugen van je chocolade. Nog geen chocolade ontvangen? Wij voorzien alvast het boeiende verhaal achter onze Artificial Digital Guide. Aan de hand van deze specifieke use case voor generatieve AI willen we de mogelijkheden en valkuilen van artificiële intelligentie aantonen.
Generatieve AI in een notendop
De beste omschrijving die we vonden, kan worden toegeschreven aan Google:
"Generatieve AI, of generatieve artificiële intelligentie verwijst naar het gebruik van AI om nieuwe inhoud te creëren, zoals tekst, afbeeldingen, muziek, audio en video's.
Generatieve AI wordt aangedreven door foundation-modellen (grote AI-modellen) die kunnen multitasken en out-of-the-box taken kunnen vervullen, waaronder samenvatten, vraag-en-antwoorden bedenken, rangschikken, etc. Bovendien kunnen deze modellen met minimale training en input worden aangepast voor specifieke gebruiksdoeleinden."
Voor velen klinkt dit misschien als ruis in de oren, en eigenlijk is het dat ook! Binnen specifieke diffusiemodellen zet generatieve AI ruis – vergelijkbaar met het statische beeld op oude breedbandtelevisies – om in een afbeelding. We illustreren dit proces met een helder voorbeeld uit de gekoppelde NVIDIA blog. Hoewel onze uitleg misschien niet mathematisch sluitend is, brengt het de kernprincipes wel doeltreffend over.
Van links naar rechts
generatieve AI-model om afbeeldingen te ontleden in statische ruis. Van links naar rechts voegt het model geleidelijk ruis toe en krijgt het inzicht in de numerieke representatie van een afbeelding – beter bekend als een ‘seed’. Een seed bestaat uit een reeks getallen die AI vertelt hoe een afbeelding moet worden gegenereerd.
Wanneer een gebruiker een prompt geeft, maakt het systeem gebruik van een groot taalmodel (Large Language Model, of LLM) om de opdracht te begrijpen en een afbeelding te genereren vanuit de geselecteerde seed. Dit is een stapsgewijs proces waarbij dezelfde afbeelding herhaaldelijk wordt doorlopen, van links naar rechts, totdat deze nauwkeurig overeenkomt met de gegeven prompt.
Stable Diffusion
Voor onze Digital Guide hebben we gebruikgemaakt van Stable Diffusion, de open-source AI-beeldgenerator. Het huidige landschap van vergelijkbare platforms groeit in sneltempo: DALL-E 2, MidJourney, Nvidia NeMo, Adobe Sensei en Google Generative AI, om er maar enkele op te noemen.
Het verhaal achter
onze Artificial Digital Guide
Ons idee was om alle Elision-gezichten samen te smelten tot één AI-gegenereerde Digital Guide. Naar de haalbaarheid was het gissen, maar het bleek perfect binnen de mogelijkheden van AI te liggen.
Hiervoor hadden we uiteraard visuele input nodig. Voor de uitwerking gebruikten we de foto's die je hier kan zien. Deze komen uit een officiële fotoshoot, met schriftelijke toestemming van alle betrokkenen. Hiermee voldoen we aan een van de belangrijkste criteria voor onze digitale gidsen: een met instemming verkregen dataset.
Volgende stap:
Gezichten samensmelten
De tool die we gebruikten liet het samensmelten van maximaal vier gezichten tegelijkertijd toe. Het resultaat hiervan zie je links. Bij het werken met AI is de zorgvuldige selectie van zowel data als output van groot belang. Factoren zoals representatie, hallucinaties (AI-verzinsels die niet sporen met de input/realiteit) en nauwkeurigheid moeten altijd worden overwogen. We selecteerden de meest representatieve gezichten gebaseerd op de afbeeldingen uit de input.
Het generatief proces werd offline uitgevoerd in een private en GDPR-veilige omgeving. Elke generatie nam ongeveer 30 seconden in beslag met de volgende computerspecificaties:
- Processor: AMD Ryzen 9 5900x 12-Core processor (24CPUs), ~3.9GHz
- Grafische kaart: NVIDIA GeForce RTX 3080 (10GB)
- Geheugen: 32 GB DDR4
- Opslag: 50 GB
Het (eerste) eindresultaat
Hieronder zie je de eerste gezichten die voortkwamen uit onze iteraties. Het was fascinerend om de geboorte van onze Artificial Digital Guide te aanschouwen: het nieuwe gezicht voor Elision.
Maar nieuwe vragen wierpen zich op.
Kiezen we voor een mannelijke of vrouwelijke Digital Guide? Vertegenwoordigen deze gezichten daadwerkelijk onze medewerkers of horen ze eerder thuis op de catwalk? Zullen onze medewerkers zich kunnen identificeren met deze persoon? Stemmen deze gezichten overeen met onze toekomstige doelen? Staan ze voor het bedrijf dat we willen zijn?
Nieuwe visie, nieuw Elision
Het werd al snel duidelijk dat deze gezichten geen juiste weergave waren van ons bedrijf. Want de Digital Guide moet inclusief zijn. Dat bracht nieuwe uitdagingen met zich mee, die we als volgt hebben aangepakt:
- Schoonheidsnormen: Schoonheid is subjectief. In het echte leven staan sommigen vroeger op om implementaties te monitoren vóór de werkuren. Uit eigen ervaring kunnen we zeggen dat dit kan leiden tot een ietwat vermoeide uitstraling. Om hiermee om te gaan hebben we onze prompt verfijnd met termen zoals ‘doorsnee uiterlijk’.
- Inclusiviteit: In onze dataset vertegenwoordigen 19 van de 25 afbeeldingen blanke mannen van Europese afkomst. Om inclusiviteit te bevorderen, verminderden we het belang van deze negentien mannen, wat resulteerde in een evenwichtigere dataset in lijn met ons beoogde resultaat.
- Trainingsdata: Bij onze beeldgeneratie kozen we voor het Juggernaut XL-model. Dit model is voornamelijk getraind op westerse acteurs en modellen, wat resulteerde in een vertekening in onze dataset. Een oplossing was het trainen van ons model met behulp van afbeeldingen van onze eigen medewerkers.
- De perfecte snit: Generatieve AI levert behoorlijk indrukwekkende resultaten op als het gaat om kapsels – misschien zelfs iets té goed ... Onze AI moest met andere woorden een bezoekje brengen aan de kapper. Uiteindelijk kozen we voor een kapsel dat een vleugje nonchalance combineert met een business-casual look.
Door het bovenstaande te implementeren kwamen we tot een gemengd resultaat dat nog steeds vragen opriep over de juistheid van de representatie. De hamvraag bleef: ‘reflecteren deze kenmerken wie we werkelijk zijn?’
Een bezoek aan de kapper
verschillende kapsels, waaronder kaal, warrig haar, man bun, geschoren, ...
Rekening houdend met de EU AI-wetgeving
In het kader van haar digitale strategie streeft de EU ernaar artificiële intelligentie te reguleren om de ontwikkeling en het gebruik van deze innovatieve technologie onder betere voorwaarden te waarborgen. AI biedt talrijke voordelen, zoals verbeterde gezondheidszorg, veiliger en ecologischer transport, efficiëntere productie en duurzamere energie. Maar het brengt ook zorgen en uitdagingen met zich mee die nauwgezette overweging vereisen.
In de AI-wetgeving worden vier risiconiveaus en bijbehorende richtlijnen opgenomen:
- onaanvaardbaar risico
- hoog risico
- minimaal risico
- specifiek transparantierisico
Onze case valt onder 'minimaal' en 'specifiek transparantierisico'. Dit motiveerde ons ervoor te zorgen dat Elision steeds voldoet aan (toekomstige) ontwikkelingen:
- Onze Artificial Digital Guide zal altijd een disclaimer bevatten: ‘Deze gids is gemaakt met behulp van AI.’ (AI-wetgeving)
- Het omgaan met subjectiviteit (bias) is het moeilijkste en tegelijk meest cruciale onderwerp. We beschreven uitgebreid welke inspanningen we hebben geleverd om subjectiviteit uit onze Digital Guide te verwijderen. Desondanks blijft een fundamentele vraag onbeantwoord: ‘Is het mogelijk voor mensen om volledig onbevooroordeeld te zijn? En bij uitbreiding: AI?’ Het belang van output- en datacuratie wordt hiermee nog maar eens benadrukt. (AI-wetgeving)
- Onze dataset werd nooit gebruikt op een AI-generatieplatform van derden, we hebben nadrukkelijk onze voortdurende eigendom van gegevens bewaakt. Van onze medewerkers hebben we de schriftelijke toestemming gekregen om hun beelden te gebruiken voor deze doeleinden. Dit benadrukt onze toewijding aan gegevensbescherming. (GDPR/toestemming)
- In lijn met dit artikel streven we naar volledige openheid over onze bronnen en tools. Bij twijfel kan je ons steeds een e-mail sturen via ons contactformulier. (AI-wetgeving)
Onthulling van
onze Artificial Digital Guide
Zijn de kenmerken van onze gids nu een ware weerspiegeling van wie we (willen) zijn? We laten het antwoord voorlopig in het midden. In de toekomst, naarmate Elision groeit, zal onze gids hoe dan ook evolueren. Deze blog is bedoeld om broodnodige discussies op gang te brengen over de sterktes en zwaktes van AI – een fascinerend en effectief instrument wanneer het juist gebruikt wordt, een potentieel gevaar wanneer dat niet het geval is.
Wij wensen je alvast een intelligent 2024 toe, en voor de gelukkigen: geniet van je Chocolade eXperience!
Hoe kunnen we je helpen?
Als full-service CX-partner ondersteunt Elision bedrijven proactief bij hun overstap naar een duurzame klantervaring. We beschikken over een uitgebreid portfolio van SAP CX- en andere toonaangevende platformen om jouw commerce-oplossing naar een hoger niveau te tillen. Ons gedreven team voorziet je van waardevolle inzichten en deelt met plezier zijn CX-expertise.