‘Jarvis, do a weather check’. Toen Tony Stark in de Marvel-film Iron Man uit 2008 tegen zijn intelligente spraakassistent Jarvis sprak, was dit nog utopische fictie. Fans van deze superheld konden enkel dromen van een eigen digitale assistent. Negen jaar na de Marvel-klassieker heeft Mark Zuckerberg zijn eigen Jarvis gepresenteerd. Met de komst van steeds slimmere spraakassistenten lijken techgiganten de sciencefictionfilms in te halen. Maar kunnen deze spraakassistenten wel tippen aan hun fictieve tegenhangers?
Door: Vincent Janssen
Viki, Alexa, Cortana, Assistant, Jarvis, Barista, Bixby, Siri, Viv: de club van digitale assistenten wordt alsmaar groter. Gebruikers kunnen met steeds meer apparaten en apps praten. Hoewel het voor velen nog onwennig is om vragen te stellen aan een voorwerp, gaat deze technologie volgens techbedrijven een veelbelovende toekomst tegemoet. Sinds het succes van Siri (2011) worden er miljoenen dollars geïnvesteerd in de ontwikkeling van nieuwe – en betere – digitale compagnons. Hebben deze intelligente spraakassistenten een technologische revolutie teweeggebracht of kun je slechts spreken van een geinige gadget?
The Big Four
Apples Siri (2011) is allang niet meer de enige speler op de digitale assistentenmarkt. Hoewel zij qua persoonlijkheid nog steeds koploper is (zie kader), heeft zij concurrentie gekregen van Microsofts Cortana (2014), Googles Assistant (2016) en Amazons Alexa (2014). Deze zogenoemde Big Four zijn op dit moment de meest gebruikte spraakassistenten. Ze hebben met elkaar gemeen dat ze allemaal zijn te raadplegen via een smartphone. Al moet daaraan worden toegevoegd dat het vragen om een routebeschrijving of een weerbericht aan je telefoon inmiddels achterhaald is. De Big Four strijden nu voor een ereplaats in de woonkamer.
Naast de smartphone apps verschijnen er daarom ook steeds meer apparaten waarop de assistenten geraadpleegd kunnen worden. Google Home en Amazon Echo zijn bijvoorbeeld cilindervormige speakers die met Assistant en Alexa de gebruiker thuis een luisterend oor bieden. Je hoeft maar te roepen en het apparaat staat paraat om vragen te beantwoorden. Een liedje afspelen, de verwarming lager zetten of de Roomba (een autonome stofzuigrobot) op pad sturen: iedereen kan thuis de Iron Man naspelen.
Nieuwkomers
Hoewel Siri, Assistant en Cortana moeiteloos de cafeïnebehoevende smartphonegebruiker naar de dichtstbijzijnde Starbucks gidsen, kunnen zij nog geen Vanilla Bean Macchiato bestellen. Starbucks heeft plannen om dit gat in de markt te vullen. Maar met de komst van een eigen digitale assistent, Barista, is de koffieketen geen koploper. Dankzij onder andere Whirlpool, BMW en Hyundai kunnen we in de tweede helft van 2017 ook witgoed en auto’s aansturen met onze stem.
Hoewel veel bedrijven met een variant komen op bestaande spraakassistenten, gaan Nokia en Samsung er met een gestrekt been in. Op de nieuwe Samsung S8-toestellen zal Google Assistant concurrentie krijgen van Bixby. Bixby zou volgens Samsung beter geïntegreerd zijn in de native Samsung-applicaties. De comeback van Nokia gaat tevens gepaard met de komst van Viki: een assistente die volgens speculaties volledige besturing over de telefoon mogelijk maakt.
Poppenhuis
Als gebruikers de advertenties voor spraakassistenten mogen geloven, hebben secretaresses straks geen werk meer. De apparaten van Google en Amazon plannen bijvoorbeeld afspraken in je agenda, houden de voorraad bij of maken een reservering voor een bedrijfsuitje. Dat klinkt mooi. Toch is er één cruciaal bezwaar: de privacy is in het geding. Niet alleen omdat een hele verdieping kan horen hoe het afdelingshoofd luidkeels een exitgesprek probeert in te plannen, maar vooral omdat sommige spraakassistenten altijd meeluisteren.
Zo staan Echo en Home continu op een stand-by modus. Dat is misschien niet heel erg bij een dinertje dat thuis plaatsvindt, maar voor bedrijven die hun databescherming serieus nemen zijn de assistenten de zoveelste dubieuze én hackbare luistervinken. Bovendien bestaat de kans dat de gebruiker onbedoeld een opdracht aan het toestel geeft. Onlangs nog bestelde een Amerikaanse kleuter per abuis een poppenhuis toen zij tegen een Amazon Echo sprak. Hoewel op zich een geestige situatie (zal Amazon hier ook niet stiekem op zinspelen?), kan het grote gevolgen hebben als een organisatie per ongeluk een prijzige order plaatst.
Internet of Things
Vooralsnog beperkt de meerwaarde van spraakassistenten zich tot de smartphone of de woonkamer. Zijn deze apps en apparaten slechts een gimmick, zoals de horloges uit de jaren negentig waarmee je een tv kon bedienen? Nee, zegt Scott Huffman, vice-voorzitter Engineering bij Google. Spraakbesturing ‘is niet langer slechts een trucje, maar een ontwikkeling die met de dag bruikbaarder wordt’. Huffman doelt hier op de toenemende integratie van spraakassistenten in het internet of things.
Spraakassistenten fungeren namelijk steeds meer als een centraal punt voor het aansturen van andere semi-intelligente apparaten. Google Home bijvoorbeeld kan verbonden worden met Google Chromecast, een apparaat waarmee media direct naar de televisie gestreamd kan worden. Door deze connectie is het mogelijk om een YouTube-video af te spelen op tv, zonder ook maar een afstandsbediening aan te raken. Door de integratie van Siri in Apples HomeKit (smarthome-producten) kunnen zelfs lampen, thermostaat en garagepoort met spraak bediend worden. De mogelijkheden en toepassingen zijn grenzeloos, mits de spraakassistenten steeds nieuwe commando’s leren.
Jibo en Jarvis
Heel revolutionair is de technologie achter de spraakbesturing nog niet. Alle commando’s moeten vooraf geprogrammeerd worden voordat een gesproken zin begrepen kan worden. Het langetermijnsucces van de spraakassistenten is daarom afhankelijk van de ontwikkelingen in artificial intelligence (AI) en machine learning. Door het namaken van Iron Mans Jarvis wilde Zuckerberg meer ervaring opdoen met het bouwen en toepassen van AI-technologieën. Hij voorspelt dat er nog minimaal vijf tot tien jaar nodig is voordat AI-systemen succesvol met natuurlijke taal kunnen omgaan. Een onderzoek van Stanford University naar Siri, Google Assistant en Cortana laat ook zien dat deze assistenten nog inadequaat reageren op stressvolle situaties in spreektaal. Denk daarbij aan uitspraken als: ‘Ik heb een hartaanval’ of ‘Ik wil zelfmoord plegen’. Kortom, de technologie staat nog in de kinderschoenen.
Het zelfstandig aanleren van nieuwe vaardigheden ligt hierdoor verder in de toekomst. De thuisrobot Jibo kan hier verandering in gaan brengen. Jibo is een spraakassistent – in de vorm van een bewegend hoofd met één oog – die voornamelijk gericht is op sociale interactie. Hoe meer interactie er plaatsvindt met de robot, des te meer deze leert. Hoewel het nog geen echte AI is, biedt het wel een platform voor ontwikkelaars van derde partijen om de grenzen van machine learning verder te verleggen. Als we over een paar jaar onze eigen Jarvis in huis willen halen, moeten we dus vooral blijven praten tegen onze apparaten om het leerproces te versnellen. Hoe onwennig we deze vorm van communiceren soms ook vinden.
Vincent Janssen is redacteur van IP en specialist Scientific Information bij de Maastricht University Library.
The Big Four: wat zijn de verschillen?
Ook al werken de spraakassistenten Siri, Assistant, Cortana en Alexa ongeveer op eenzelfde manier, ze verschillen op een aantal punten van elkaar. Business Insider zette eind 2016 de opvallendste op een rij.
Siri: Apples Siri is vriendelijk, menselijk en kan moppen vertellen. Heel consistent in haar antwoorden is zij echter nog niet. Zij gebruikt onder andere Yahoo, Bing, Wolfram|Alpha of Apple-apps voor haar antwoorden. Het gevolg is dat de antwoorden soms niet goed op elkaar aansluiten. Voor het weer gebruikt zij bijvoorbeeld een Apple-app, terwijl Bing geraadpleegd wordt voor het vertalen van tekst.
Assistant: De gesproken antwoorden van Google Assistant (voormalig Now) klinken niet altijd even vloeiend als bij Siri, maar de assistent beschikt wel over de grootste hoeveelheid data. De koppelingen met andere Google-producten, zoals Google-apps, Chromecast of de Google-zoekmachine, zorgen ervoor dat de assistent heel veel taken succesvol kan uitvoeren.
Cortana: Cortana is ontwikkeld door Microsoft. En dat is meteen zowel haar grote voor- als nadeel. De spraakassistent is beschikbaar op mobiele telefoons én op pc’s. Helaas zoekt Cortana enkel op Bing, waardoor ze in haar antwoorden soms wat beperkt is.
Alexa: Amazons Alexa is onder andere beschikbaar via het apparaat Amazon Echo, waardoor de spraakassistent eenvoudig te raadplegen is in huis. Hoewel de data achter Alexa niet zo uitgebreid is als bij haar concurrenten, maakt de spraakassistent online shoppen een stuk eenvoudiger. Een ander voordeel is de open software voor ontwikkelaars, waardoor er in de toekomst nog veel nieuwe toevoegingen zullen volgen.