Door: Casper Frericks (Developer)

Artificial intelligence, deep learning, zelfregulerende systemen, data analytics, machine learning... Alle buzzwords van het moment komen op de Big Data Expo langs. Bij dezen een verslag van dag 1 van dit event en de take aways voor merchants in E-commerce:

 

Ontwikkelen is blijven leren

Één van de meest uitdagende maar tegelijkertijd ook meest confronterende realiteiten van de (informatie)technologiesector is dat je nooit uitgeleerd bent. Of je nu als Business Consultant de klant een zo’n goed mogelijke oplossing wil bieden, als Developer de taak op je neemt deze te implementeren of bijvoorbeeld als servicedeskmedewerker ook daadwerkelijk van de nieuwste systemen gebruik moet maken, eigenlijk ben je nooit uitgeleerd. Ik zou durven stellen dat een mens in een normaal mensenleven – transhumanisten zouden het graag anders zien – er niet aan toekomt om van elke technologie meester te worden.

 

Big Data Expo

Dit besef wordt des te groter wanneer je je bevindt op een technologiebeurs. In dit specifieke geval loop ik rond op de Big Data Expo in de jaarbeurs van Utrecht. Dit tweedaags evenement richt zich op concrete toepassingen van Big Data. Ook voor de e-commerce markt liggen hier veel kansen en mogelijkheden om de consument te binden of te handelen op basis van vergaarde gegevens. Het meest opvallende? Het buzzwoord Artificial Intelligence valt zeer geregeld. Niet vreemd met de opkomst van zelflerende systemen die zich continu verbeteren aan de hand van feedback op hun eigen bevindingen. Een goudmijn voor datawetenschappers en voor velen de onvermijdbare toekomst voor het coördineren van bedrijfsprocessen. Er vindt dan ook gretig aftrek plaats van de zitplaatsen voor de lezingen die hier mee in aanraking komen. En terecht, want de interesse is groot en het aanbod aan zitplaatsen klein.

 

Kleinschalig

En hiermee stuit ik op mijn eerste minpunt van de dag. Het is klein. Té klein. Ik bevind mij in hal 4 van de Jaarbeurs en als je de plattegrond erbij zou pakken kan je stellen dat dit een van de kleinere hallen is dat de jaarbeurs te bieden heeft. Begrijp me niet verkeerd, als hier een grote DJ stage zou staan, volstaat de zaal voor een indoor techno festival. Maar voor een beurs met tientallen stands, een tiental lezingenzalen en, naar hun eigen zeggen, 3500 bezoekers is de locatie veel te klein om iedereen te kunnen bedienen. Wel kunnen we hier een prachtige ironie in vinden: dit hadden ze hoogstwaarschijnlijk kunnen voorspellen, aan de hand van hun eigen data en het zo volprezen machinaal leren. Ter illustratie: ik schrijf dit blogartikel nu tijdens de lunch waar een rij voor de broodjeszaak staat dat bij lange na niet aan het einde van de lunch weggewerkt zal zijn. Dat krijg je als alle lezingen tegelijk voor de lunch eindigen. Optimalisatie mogelijkheden all over the place!

 

Sprekersprogramma

Laten we daarom even teruggaan naar de lezingen zelf. Want in alle eerlijkheid zal ik toegeven dat hoewel ik bedrijven als Elastic, Microsoft en Datastax erg gaaf vind, het niet de commerciële verkooppraatjes zijn bij hun uitgebreide stands waar ik voor kom. De informatie die zij daar bieden kan je in feite altijd zelf vinden op hun bedrijfswebsite of YouTube kanaal. De technologie staat voor niets. Nee, het zijn de lezingen van verschillende bedrijven die mijn aandacht volledig hebben getrokken. En hun programma is helemaal niet verkeerd. Voor mij een uitgelezen kans om kennis te vergaren van daadwerkelijk in gebruik genomen toepassingen van Data Analytics en Machine Learning die geïmplementeerd is, getest is en bewezen is. En een uitgelezen kans voor Experius om hier inspiratie tot innovatie op te doen. Mits je uiteraard binnen komt…

 

Lezing 1: The Human Factor in Artificial Intelligence”.

Gelukkig ben ik voor de eerste lezing ruim op tijd en vergezelt mijn collega Peter van der Reijden mij. Nadat we een verplicht kort kennismakingspraatje over een nieuwe app voor het uitwisselen van visitekaartjes hebben aangehoord in ruil voor een kop koffie, staan we een goede 20 minuten voor tijd netjes in een op dat moment nog zeer korte wachtrij. Even daarna kunnen we direct een prachtige plek bemachtigen op de voorste rij, midden voor een scherm. De eerste lezing heeft de pakkende titel “The Human Factor in Artificial Intelligence”. De spreekster was de Head of Data & Research bij Walmart Labs, welke onder ander de E-commerce tak hebben van Walmart. Ik zeg was, want inmiddels bekleedt deze vrouw dezelfde functie maar dan bij Atlassian. Onder ander erg bekend van Atlassian Jira. In feite heeft ze precies waar gemaakt wat de titel mij belooft, een lezing over de voordelen en het belang van het hebben van een menselijk curator van zowel de data als de gebruikte modellen. Dit zorgt voor kwalitatieve goede ‘tagged data’. Hierbij maken we onderscheid tussen impliciete en expliciete tagging. Een relevante en veel voorkomende situatie van impliciete tagging in de E-commerce is het moment dat een consument de koop knop indrukt en de koop daarmee afrondt. Een mogelijke retour buiten beschouwing gelaten is deze actie natuurlijk een voorbeeld van een tag dat weerspiegelt dat de combinatie van de gekochte producten in combinatie met deze klant als correcte data kan worden beschouwd, door een mens bevestigt. Het systeem wordt daarmee vanzelfsprekend menselijker en relevanter. Het inhaken op deze classificatie nadat een order besteld is draagt daarmee automatisch bij aan het verzamelen van deze waardevolle gegevens. Loggen maar!

 

 

Lezing 2: Deeplearning for e-commerce

De lezing met de pakkende titel “Deeplearning for e-commerce” begint en ik word helaas teleurgesteld met de mededeling dat de lezing zich zal focussen op classificatie van productfoto’s. Ook zeker relevant voor de e-commerce, een goede use case is het automatisch categoriseren van producten aan de hand van diens productafbeeldingen. Zo wordt in de lezing bijvoorbeeld getraind op een dataset van lange mouwen shirts en kan na duizenden afbeeldingen geclassificeerd te hebben nu automatisch producten aan de hand van hun foto met lange mouwen herkennen. Echter had ik bij dit onderwerp persoonlijk meer gehoopt op toepassingen binnen de customer experience of (sales) optimalisatie voor de merchant. Image Recognition is namelijk een redelijk breed AI-gebied op zichzelf. Er zijn hier echter een hoop toepassingen voor te bedenken die dit gebied ook voor e-commerce geschikt maken. Met het automatisch categoriseren is bijvoorbeeld een geautomatiseerde Quality Assurance van je catalogus mogelijk. Elke nacht draait er een automatische taak die op je getrainde dataset van je catalogus kijkt of er mogelijk verkeerde afbeeldingen bij een product staan, zet deze vervolgens in een overzicht zodat jij de volgende dag eventuele fouten kan corrigeren. En mocht het toch juist zijn, dan leert het systeem daar alleen maar van!

 

Vervroegde pauze

Mijn derde lezing vond wederom in deze zelfde Keynote zaal plaats. Helaas bestond er ditmaal geen mogelijkheid om via een Premium Seat voor de allang gevormde rij te kunnen kruipen en was ik genoodzaakt een eerder dan geplande pauze in te lassen. De lezing “Hoe gebruik je Big Data Analytics voor Personalisatie?” liet ik daarom maar even schieten, ook al was dit met zekerheid interessant om bij te wonen. De officiële lunchpauze ging daarna ook in, dus ik had ruim anderhalf uur even geen plan. Welaan, een mooi moment om even rustig eens de rest van de beurs te bekijken. Ik loop wat rond en langzaam begint het schouwspel tot mij door te dringen. De suffe stands die je bij elke beurs verwacht zijn duidelijk niet meer van deze tijd. Om die gewilde potentiële nieuwe relaties binnen te halen en het kennismakingspraatje met je te verzilveren wordt alles uit de kast gehaald. Van volledig door een barista gerunde “gratis” koffiehubs en verse smoothie machines tot speelgoedracebanen en een heuse silent disco boot, maar dan zonder de disco en met meer presentatie.

 

Lezing 3: Predictive Models en Artificial Intelligence: van experimenteren naar incorporeren

Geleerd hebbende uit mijn eigen historische data concludeerde ik dat voor het bijwonen van deze lezing ik in ieder geval ruim voor het einde van de lunch van de andere bezoekers in de rij moest staan. Met succes mag ik wel zeggen. Hoewel ik niet eens de allereerste was, sloot er na 5 minuten een hele stroom mensen achter mij aan. Wat kan dat zelflerend systeem toch prachtig zijn. De spreker is werkzaam bij de ABN Amro als Strategy Consultant Advanced Analytics. Een mondvol en een voorbode voor een minstens met zoveel jargon gevulde presentatie. Desalniettemin een erg interessante presentatie waarin de toepassing van AI binnen een grote financiële corporate wordt toegelicht. Er vallen hier vooral lessen te halen uit hoe men voorkomt dat je steeds groter wordende infrastructuur van (fysieke) systemen uit de hand loopt en beheersbaar blijft. Een belangrijk aangestipt aspect is hierbij dat systemen interopability moeten promoten. Anders gezegd: het ene systeem moet het andere systeem probleemloos kunnen aanspreken. Een op een development omgeving ontwikkeld model in R zal niet kunnen draaien op een productie server waar slechts Python op geïnstalleerd staat.

 

Lezing 4: Machine learning & Sales prediction for eCommerce website

De vorige lezing was 15 minuten voor tijd klaar en daarom was er een vragen ronde mogelijk. Met voorheen genoemde wijsheid sloop ik de zaal uit en wist ik zo vooraan de rij te staan voor deze onmisbare lezing. Wat mij betreft een van de hoogtepunten van de dag. En hoewel ik naarstig aantekeningen maakte van alle informatie die ik tot mij nam, heb ik bij deze lezing veruit het minste opgeschreven. Niet omdat ik het niet interessant vond, integendeel, dit was uiterst leerzaam. Maar de sprekers kwamen uit Frankrijk en na 5 minuten een Fransman Engels sprekend gehoord te hebben wist ik dat ik al mijn concentratie moest reserveren voor het aandachtig luisteren naar zijn verhaal om het te verstaan. De lezing werd vergezeld met een live demo met handig gebruik van Apache Zeppelin. Apache Zeppelin is een zogeheten Notebook software waarmee je visueel op één en dezelfde webpagina meerdere analyses en code kan uitvoeren om zo direct inzicht te krijgen in resultaten met leesbare grafieken. Het voorbeeld dat gepresenteerd werd was minstens zo praktisch. Het betrof een voorspellingssysteem van de benodigde voorraad aan de hand van Machine Learning. Aan de hand van voorgaande data kon het systeem voor het komende jaar voorspellen hoeveel voorraad er van een bepaald product nodig was. Zo wist hij pieken tijdens de kerst te voorspellen en kwam deze heel accuraat overeen met de realiteit. Nou klinkt dat natuurlijk erg logisch, maar veel mensen zijn zich van minder extreem stijgende pieken niet bewust. Een door Machine Learning verwacht patroon kan hier veel inzicht in geven. En ook hier moet wederom niet vergeten worden dat het systeem blijft leren met de data dat het zich nieuw toegediend krijgt en vindt het een patroon dat je zelf niet verwacht had.

 

Lezing 5: How the Insights Lab drives the “perfect store”

Mijn laatste lezing is ook de meest verrassende. Ik had nog niet helemaal opgemerkt dat Heineken deze presentatie verzorgde, tot er voor mijn neus een enorm Heineken biertje verscheen. Het Heineken Insights Lab streeft vooruit om zoveel mogelijk te innoveren waar het kan. Daarmee krijgt het lab een enorme vrijheid waarin ze heel veel mogelijkheden krijgen tot experimenteren. Door hun vrijheid zijn ze dus niet beperkt om ook onderzoeken op te pakken die wellicht veel tijd kosten of in eerste opzicht minder innovatief lijken te zijn maar potentieel toch veel kunnen op leveren. Heineken is natuurlijk een wereldbedrijf van formaat en het valt goed in te beelden dat zij veel (geautomatiseerde) systemen gebruiken om voorraad, logistiek, verkoop en marketing te opereren en te controleren. Zowel offline als online krijgen zij te maken met veel uitdagingen. Maar op sales gebied valt er veel van ze te leren! Zo zijn er veel terugkomende klanten die eigenlijk het hele jaar door op hetzelfde patroon bestellen (bokbieren in de lente en herfst, witbieren in de zomer etc). Wanneer het systeem dit patroon meerdere jaren oppikt, biedt Heineken hen een abonnement aan. De afnemer krijgt daarmee een persoonlijkere benadering met een korting en Heineken is een vaste klant rijker. Echter heeft het systeem ook geconcludeerd dat een klant die 2-4 keer langer dan de gemiddelde tijd tussen zijn bestellingen bestelt een enorm hoge kans heeft nooit meer terug te keren. Actie ondernemen dus!

 

Conclusie

Mijn gedachte dat er veel voor de e-commerce sector te winnen valt door middel van intelligente systemen wordt vandaag maar weer eens bevestigd. We kunnen eigenlijk niet meer om Data Driven Organizations heen. Hoewel een machine (nog?) niet alle menselijkheden perfect kan indexeren is het daarentegen zeker in staat om beslissingen te maken die niet op basis van emotie of gevoel zijn. Acteren op basis van feiten is daarmee nog nooit zo binnen handbereik geweest. De komende jaren zullen we dan ook een verschuiving zien op de manier hoe wij met de consument interacteren. Beter, persoonlijker en meer voldoend aan de wensen van de klant. Scherper in de markt staan door het voorspellen van vraag en aanbod. Spannend en veelbelovend! Net als de tweede dag van de Big Data Expo, dus op naar morgen!

Mail marketing@experius.nl

Phone 030-8200238