Kunstmatige intelligentie: Machine learning: trend of hype?

Je kunt geen blog, blad of tweet meer openslaan, of machine learning komt ter sprake – een duidelijk teken van een hype. In de laatste aflevering van Gartners hype cycle stond machine learning helemaal bovenin de ‘peak of inflated expectations’, met de verwachting dat ‘mainstream adoption’ nog wel twee tot vijf jaar kon duren.* Met die ‘inflated expectations’ zullen Google en allerlei andere grote techbedrijven het vast niet eens zijn, want die zetten er zwaar op in en passen de techniek al volop toe. Maar zij zijn natuurlijk ook niet ‘mainstream’.

Door: Eric Sieverts

Machine learning is een techniek uit het domein van de kunstmatige intelligentie, die vooral wordt ingezet voor het oplossen van complexe problemen. Die worden vaak gekenmerkt door de aanwezigheid van zo grote aantallen parameters en afhankelijkheden dat die niet meer allemaal afzonderlijk kunnen worden onderscheiden en niet meer vooraf gemodelleerd kunnen worden met een hanteerbaar aantal ‘als-dan’-regels. Het idee van machine learning is om een computerprogramma het dan maar zelf te laten uitzoeken, op basis van voorbeelden waaruit de machine kan leren.

Daarbij wordt vaak onderscheid gemaakt tussen technieken voor supervised en unsupervised learning. Supervised learning houdt in dat een systeem wordt getraind door voordoen. Door het een heleboel voorbeelden aan te bieden en er telkens bij te vertellen waar het een voorbeeld van is, zoals bijvoorbeeld gebeurt bij documentclassificatie of bij automatische beeldherkenning. Of door handelingen onder allerlei omstandigheden voor te doen, zodat een robot of een zelfrijdende auto vanzelf leert hoe die handelingen gedaan moeten worden. Bij unsupervised learning moet het computerprogramma het echt helemaal zelf uitzoeken, door in het aangeboden trainingsmateriaal bijvoorbeeld patronen te herkennen.

Deep learning

Deze technieken worden – door onder meer Google – ook wel deep learning genoemd. Vorig najaar heeft Google hiervoor ontwikkelde software als open source beschikbaar gesteld, onder de naam TensorFlow. Zelf gebruiken ze het om daarmee allerlei specifieke toepassingen te ontwikkelen. Zo zorgt bijvoorbeeld Rankbrain dat hun zoekmachine steeds beter leert begrijpen wat zoekers met hun vragen bedoelen, zodat de ranking van zoekresultaten daarop aangepast (en dus verbeterd) wordt. DeepMind is gespecialiseerd in spellen en heeft intussen zo goed het denkspel Go leren spelen, dat het de wereldkampioen heeft verslagen.

Gebruikte technieken

Voorbeelden van toepassingen van machine learning staan in bijgaand kader. Elk soort toepassing vraagt haar eigen aanpak en optimale daarvoor te gebruiken techniek. De technieken of algoritmes die bij machine learning worden toegepast zijn namelijk heel divers. Zo zal voor een toepassing waarbij tekst – dus letters en woorden – geanalyseerd moet worden om daaruit af te leiden waar die over gaat, een andere techniek worden toegepast dan bij de analyse van beeldmateriaal waar alleen maar pixels beschikbaar zijn. Welke techniek voor een bepaalde toepassing het beste werkt, kan vaak nog niet nauwkeurig voorspeld worden. In de praktijk moet dus nog veel worden uitgeprobeerd. Een techniek die in dit verband veel genoemd wordt is die van neurale netwerken. Dat is al een betrekkelijk oude techniek. Maar door de beschikbaarheid van steeds meer rekenkracht kan die nu voor steeds meer en steeds complexere problemen worden ingezet. Vooral voor visuele problemen schijnt dat succesvol te zijn, of dat nu gaat om herkenning van onderwerpen in beeldmateriaal of het interpreteren van de ruimtelijke stelling bij het Go-spel. Google noemt zijn vertaalmodule ook al ‘neural machine learning’.

Beeld herkenning

Bij beeldherkenning wordt met zogenaamde feature extraction een veelheid aan karakteristieken van een afbeelding geanalyseerd. Dat leidt tot een soort profielen of vingerafdrukken van die afbeeldingen. Voor het leerproces is vervolgens veel inhoudelijke input nodig. Voor elk te herkennen onderwerp is een flink aantal zorgvuldig geselecteerde voorbeeldafbeeldingen vereist. En soms zowel positieve als negatieve voorbeelden. En dan nog kan zo’n systeem alleen die voorstellingen herkennen waarop het getraind is. Daarom wordt ook gebruik gemaakt van grote corpora met al (inhoudelijk) beschreven materiaal, waarin in principe bijna alle onderwerpen al voorkomen. Die beschrijvingen kunnen bijvoorbeeld de tags of zinnetjes zijn, die men op een uploadsite als Flickr aan foto’s heeft toegekend.

Complex

Op dit terrein is ook Google actief, in eerste instantie om tags toe te kennen aan door gebruikers in Google Photo geüploade foto’s. Daarnaast experimenteert Google met het in zinnen omschrijven van wat op een foto is afgebeeld, zoals ‘a person on a beach flying a kite’. Voor de verschillende elementen uit een foto kunnen daarvoor gegevens uit diverse voorbeeldfoto’s gecombineerd worden. Overigens komen herhaaldelijk voorbeelden in de media van onjuiste, vaak politiek niet correcte, of zelfs ronduit kwetsende tags of beschrijvingen. Soms zijn dat echte fouten, soms reflecteert het domweg discriminerend of racistisch taalgebruik in het materiaal waaruit geleerd wordt. Dat nadeel van zelflerende systemen die helemaal aan zichzelf worden overgelaten, kan bijvoorbeeld ook optreden bij chatbots die leren van de discussies die gevoerd worden. Een probleem is ook dat deze modellen zo complex zijn geworden, dat meestal niet meer nagegaan kan worden op basis waarvan ze hun conclusies getrokken hebben. Zelfs de technici van Google begrijpen hun werking niet meer precies.

Tot slot

Uit de gegeven voorbeelden blijkt dat machine learning al aardig bezig is zich van een hype naar een trend te ontwikkelen. De grote techbedrijven stimuleren dat ook flink, door software ter beschikking te stellen waarmee inventieve ontwikkelaars zelf nieuwe toepassingen kunnen bouwen. Google doet dat met TensorFlow, IBM met Watson. Voor bedrijven biedt Google machine learning ook als cloud-dienst aan. Zelfs voor de doe-het-zelver verschijnen regelmatig aankondigingen van systemen waarmee niet-nerds de toepassing van machine learning kunnen uitproberen.


Voorbeelden

  • automatische documentclassificatie
  • automatische herkenning van objecten in beeldmateriaal
  • natuurlijke taaltechniek, zoals die waarmee Google uit zoekvragen van gebruikers probeert af te leiden wat die echt bedoelen
  • medische expertsystemen die artsen kunnen ondersteunen bij het stellen van diagnoses
  • chatbots
  • software voor automatische spraakherkenning
  • software voor automatische vertaling
  • de zelfrijdende auto
  • predictive policing, waarbij op basis van oude gegevens over crimineel gedrag, voorspellingen over (de kans op) toekomstige inbraken worden gedaan
  • automatisch inkleuren van zwart-witfoto- en filmmateriaal

Eric Sieverts is redacteur van IP en freelance docent en adviseur.

Deze bijdrage komt uit IP nr. 9 / 2016. Het gehele nummer kun je hier lezen.