BRUSSEL - Lernout & Hauspie Speechproducts bedrijft een technologie die enkele jaren geleden nog science fiction leek, maar die nu stilaan vorm begint te krijgen in produkten. En als het van Jo Lernout en Paul Hauspie afhangt, is ze binnen enkele jaren spraakmakend.
L&H is met drie deeltechnologieën van de spraaktechnologie aktief op vier markten.

De drie technologieën zijn spraakherkenning, spraaksyntese en spraakkompressie. Samen maken ze het mogelijk dat de mens voor de kommunikatie met een computer geen beroep meer moet doen op instrumenten zoals een klavier, een muis en ingewikkelde kommando's. In plaats van die onnatuurlijke tussenschakels (interfaces) komt de spraak, in twee richtingen: van mens naar computer en van computer naar mens.

Het technologisch werk van het taalfabriek begint op het terrein, waar onderzoekers een databank verzamelen van alle mogelijke klanken die een taal rijk is. Bij dat veldwerk moeten de onderzoekers rekening houden met de verschillende dialekten en stemtimbres en ook met verschillende akoestische omgevingen. Hetzelfde woord klinkt heel anders in een auto, door een telefoon of in de open lucht. Met die databank wordt de computer dan getraind. In een tweede stap voeden linguïsten de computer met de regels over de verbinding tussen bepaalde klanken en bepaalde woorden en met betekenis- en grammatische regels. In de derde stap zorgen de ingenieurs ervoor dat de technologie kan draaien op verschillende soorten computers en programma's.

Door de technologie van de spraakherkenning ,,verstaat'' een computer menselijke spraak. De technologie staat nog lang niet zover dat eender wie eender wat aan een computer kan gaan vertellen. Maar ze is wel klaar voor specifieke toepassingen waar de woordenschat en het aantal uitdrukkingen relatief beperkt zijn. Een dokter zou zijn medisch verslag aan de computer kunnen dikteren, of een advokaat zijn brieven, of een hotelgast het uur waarop hij wil gewekt worden. De computerfirma Unisys werkt met L&H-technologie aan een tele-banktoepassing, waarbij een klant via de telefoon en in een dialoog die griezelig natuurlijk lijkt, inlichtingen krijgt over een hypoteeklening. (,,Geef mij maar een variabele rente,'' zegt de klant. ,,Wil u een aanpassing om de twee jaar of om de vier jaar,'' vraagt de computer dan.)

Door spraaksyntese kan de computer ook antwoorden, of een geschreven tekst uitspreken. Zo'n computerstem klinkt nu nog heel syntetisch, maar L&H staat al redelijk ver met computerstemmen die het menselijk stemtimbre dicht benaderen. De derde technologie, de kompressietechnologie, zorgt ervoor dat de enorme hoeveelheid gegevens die spraak bevat, samengedrukt wordt, zodat ze minder geheugenruimte inneemt.

,,We hebben al wel wat konkurrenten in elk van de drie technologieën waar we mee bezig zijn,'' zegt Jo Lernout. ,,Maar onze grote troef is dat we de drie technlogieën samen beheersen.'' De tweede grote troef is de meertaligheid. L&H heeft al spraakherkenning in het Brits Engels, het Amerikaans Engels, het Nederlands, het Frans, het Duits en het Italiaans. Chinees, Arabisch en Japans zijn in ontwikkeling.

Met die drie technologieën gaat L&H naar vier markten. De automarkt, computers en multimedia, telekommunikatie en konsumentenelektronika.

De L&H-technologie wordt al gebruikt in enkele honderden toepassingen. ,,De 65 kontrakten die we tot vandaag al afsloten, zitten mooi verspreid over het rooster dat de drie technologieën en de vier markten vormen,'' zegt Paul Hauspie. Alleen de markt van de konsumentenelektronika (een televisie waar je aan kan vragen of er vanavond voetbal is) zal nog enkele jaren moeten wachten op betaalbare toepassingen.

Wist je dat je ook zonder abonnement elke maand 3 betalende  plus-artikels kunt lezen?

Lees gratis ›

Vul je e-mailadres en wachtwoord in