Jo Lernout en Paul Hauspie
©fdm

Om op het Internet te gaan, zullen kleinere apparaten worden gebruikt waarbij de stem het toetsenbord zal vervangen, schrijft George Cole.

Wanneer Asif Naseem in een hotelkamer zit en zijn aandelenportefeuille wil controleren, neemt hij zijn gsm. Maar in plaats van naar zijn makelaar te bellen, belt hij naar een website die informatie geeft over aandelenkoersen. Hij krijgt die informatie te horen en niet te lezen.

Binnen het jaar of zo zullen sprekende websites algemeen verspreid zijn omdat de leveranciers van ,,inhoud'', service providers en webontwikkelaars spraaktechnologie zullen gebruiken om hun webpagina's te verbeteren.

De mogelijkheid om zowel spraak als tekst en grafische elementen aan te bieden, is het belangrijkste element van de opkomende markt voor mobiele elektronische handel (m-commerce) en van voice-enabled e-commerce (v-commerce) of elektronische handel met spraaktechnologie. In plaats van op het Internet te gaan via een pc, gebruikt m-commerce gsm's, zakcomputers, digitale agenda's en andere draagbare apparaten. Transacties met v-commerce kunnen ook worden uitgevoerd via een telefoon die met een vaste lijn verbonden is met een website.

,,Voor multimediapresentaties is er niets beters dan een pc maar als mobiliteit belangrijk is, is de computer niet het antwoord'', zegt Dan Furman, voorzitter van Lucent Speech Solutions. Furman voegt eraan toe dat naarmate een website gepersonaliseerd wordt, er veel meer informatie toegankelijk moet zijn zonder pc. ,,Verkeersinformatie is nuttiger via een gsm in de wagen dan op pc.''

Alles wijst erop dat steeds meer mensen op het Internet zullen gaan via een gsm eerder dan via een pc. Datamonitor, het bedrijf dat marktonderzoek verricht, voorspelt dat de Europese gsm-markt tegen 2005 meer dan 270 miljoen gebruikers zal hebben. Dan zal de derde generatie gsm's drie jaar op de markt zijn. Ovum, het onderzoeksbureau voor technologie en telecommunicatie, zegt dat er tegen eind 2005 wereldwijd bijna 500 miljoen gebruikers van m-commerce zullen zijn, wat meer dan 200 miljard dollar aan inkomsten betekent.

Bedrijven zoals Nokia en Motorola hebben gsm's op de markt gebracht die de wap-technologie (Wireless Application Protocol ) gebruiken, een tussenstap op weg naar de technologie van de derde generatie.

Met een wap-gsm kan je tekst en grafische informatie opvragen op bepaalde websites en je kan hem gebruiken voor m-commerce. Maar de technologie krijgt kritiek.

,,Een wap-gsm gebruiken is niet handig omdat je kleine knopjes moet indrukken op een piepklein toetsenbord'', zegt Gaston Bastiaens, algemeen directeur van Lernout en Hauspie, het West-Vlaamse bedrijf voor spraaktechnologie. ,,Het zou veel beter zijn als je tegen je gsm kon zeggen: ,Breng me bij Amazon.com'.''

L&H heeft een prototype ontwikkeld van een mobiel apparaat voor m-commerce. De Nak (afkorting van Nakulu , het Hawaïaanse woord voor echo) gebruikt spraaktechnologie om e-mails te versturen en te ontvangen, eenvoudige opdrachten te geven en elektronische transacties uit te voeren.

Motorola heeft het Mix-concept (Mobile Information Exchange ) ontwikkeld waarmee mobiele gebruikers informatie kunnen opvragen van hun pc of van het Internet met gesproken commando's.

Bij sprekende websites staan twee technologieën centraal. ASR-systemen (Advanced Speech Recognition -- geavanceerde spraakherkenning) gebruiken algoritmen om spraak om te zetten in computertaal en het dan te interpreteren. Veel ASR-systemen vereisen niet veel opleiding en kunnen dus worden gebruikt door veel mensen. Daarbij kunnen de gebruikers normaal spreken en de ASR-software is ontworpen om iets op verschillende manieren te begrijpen, zoals ,,Breng me naar Amazon.com'' of ,,Ik wil naar Amazon.com gaan''.

De tweede technologie is text-to-speech -software (TTS of tekst naar spraak). Die technologie converteert computergegevens naar spraak en is de jongste jaren enorm geëvolueerd. De RealSpeak-technologie van L&H bijvoorbeeld gebruikt echte menselijke stemmen. ,,We kunnen nu een menselijke stem in een computer stoppen en maken dat die tegen jou spreekt, in verschillende talen'', zegt Bastiaens.

Sommige sprekende websites zijn ontworpen voor pc-gebruikers. Het Britse bedrijf Oneview.net bijvoorbeeld heeft een sprekende webpagina ontwikkeld voor Impact, een bedrijf dat oplossingen biedt voor gesproken boodschappen. Wanneer een bezoeker inlogt op de website van Impact krijgt hij of zij een gesproken verwelkoming te horen. Naarmate de gebruiker door de pagina's bladert, krijgt hij informatie te horen over Impact.

Het Londense bedrijf Tangozebra heeft het programma N-Xec ontwikkeld waarmee ontwikkelaars van websites vooraf ingesproken sequenties kunnen inlassen die een tijdselement kunnen bevatten. Een bezoeker kan bijvoorbeeld te horen krijgen: ,,Binnen vijf minuten geven we u daar informatie over.'' N-Xec werkt met bestaande browsers zodat pc-gebruikers geen speciale programma's moeten downloaden.

Tangozebra richtte zich met N-Xec in het begin vooral op de reclamesector maar directeur James Booth zegt dat de technologie gebruikt kan worden voor e-commerce. ,,Van alle bezoekers van sites voor on-lineshopping verlaat 75 procent de site, misschien uit angst of verwarring. Spraak kan dienstig zijn om de consumenten door het aankoopproces te leiden, bijvoorbeeld om hen eraan te herinneren hun postcode te vermelden bij hun bestelling.''

Een ander Brits bedrijf, Vocalis, heeft SpeechHTML ontwikkeld, een spraaktechnologie waarmee telefoongebruikers een specifiek nummer van een website kunnen opbellen en zo gesproken informatie kunnen krijgen. Hoewel SpeecHTML zich vooral richt op sectoren als gezondheidsdiensten, zegt manager Mike Williams dat het mogelijk is de technologie aan te passen voor v-commerce of m-commerce.

Een van de problemen bij het gebruik van spraak op het Internet is dat de programmeertaal HTML die wordt gebruikt om webpagina's te maken, bedoeld is voor visuele media zoals tekst en grafische elementen en moeite heeft met de technische problemen van webpagina's met spraak.

Een aantal bedrijven heeft daarom voice browsers ontwikkeld die gebaseerd zijn op een andere programmeertaal, XML (extended mark-up language ). Motorola heeft VoxML ontwikkeld en heeft een softwarekit en website gelanceerd om dat te promoten. Nu al hebben 1.400 ontwikkelaars van software meer dan 4.000 VoxML-applicaties gecreëerd.

,,Een service provider zou die applicaties op een centrale website kunnen plaatsen waarop spraaktechnologie wordt aangeboden. Zo zou het niet duur zijn om spraaktechnologie aan een website toe te voegen'', zegt Asif Naseem, die directeur is van de wereldwijde groep van Motorola die zich bezighoudt met het zoeken naar oplossingen op het vlak van spraaktechnologie.

Meer dan 100 bedrijven, waaronder AT&T, Lucent, IBM en Motorola, steunen de ontwikkeling van VoiceXML (voice extensible mark-up language ), de standaardtechnologie voor spraakbrowsers. Momenteel buigt het W3C (World Wide Web Consortium ), dat de standaarden bepaalt voor het Internet, zich over VoiceXML.

Sprekende websites zullen ook nieuwe soorten webservers vereisen. Lucent Technologies heeft de SpeechServer ontwikkeld. SpeechServer werkt met 16 processorchips van PowerPC, verbindt de database van een service provider met het Internet en werkt met VoiceXML.

Intel en L & H hebben ook een intelligente webserver voor e-commerce ontwikkeld waar mensen tegen kunnen praten: ,,Ons doel is van de stem de nieuwe poort naar het Internet te maken'', zegt Bastiaens.