BRUSSEL - Lernout & Hauspie Speechproducts bedrijft een technologie
die enkele jaren geleden nog science fiction leek, maar die nu
stilaan vorm begint te krijgen in produkten. En als het van Jo Lernout en
Paul Hauspie afhangt, is ze binnen enkele jaren spraakmakend.
L&H is met drie deeltechnologieën van de spraaktechnologie aktief op
vier markten.
De drie technologieën zijn spraakherkenning, spraaksyntese en
spraakkompressie. Samen maken ze het mogelijk dat de mens voor de kommunikatie met een computer geen beroep meer moet doen op instrumenten zoals een klavier, een muis en ingewikkelde kommando's. In plaats van die onnatuurlijke tussenschakels (
interfaces) komt de spraak, in twee richtingen: van mens
naar computer en van computer naar mens.
Het technologisch werk van het taalfabriek begint op het terrein, waar
onderzoekers een databank verzamelen van alle mogelijke klanken die een taal
rijk is. Bij dat veldwerk moeten de onderzoekers rekening houden met de
verschillende dialekten en stemtimbres en ook met verschillende akoestische
omgevingen. Hetzelfde woord klinkt heel anders in een auto, door een telefoon
of in de open lucht. Met die databank wordt de computer dan getraind. In
een tweede stap voeden linguïsten de computer met de regels over de
verbinding tussen bepaalde klanken en bepaalde woorden en met betekenis- en
grammatische regels. In de derde stap zorgen de ingenieurs ervoor dat de
technologie kan draaien op verschillende soorten computers en programma's.
Door de technologie van de spraakherkenning ,,verstaat'' een computer
menselijke spraak. De technologie staat nog lang niet zover dat eender wie
eender wat aan een computer kan gaan vertellen. Maar ze is wel klaar voor
specifieke toepassingen waar de woordenschat en het aantal uitdrukkingen
relatief beperkt zijn. Een dokter zou zijn medisch verslag aan de computer kunnen
dikteren, of een advokaat zijn brieven, of een hotelgast het uur waarop
hij wil gewekt worden. De computerfirma Unisys werkt met L&H-technologie aan een tele-banktoepassing, waarbij een klant via de telefoon en in een
dialoog die griezelig natuurlijk lijkt, inlichtingen krijgt over een
hypoteeklening. (
,,Geef mij maar een variabele rente,'' zegt de klant. ,,Wil u een aanpassing om de twee jaar of om de vier jaar,'' vraagt de computer
dan.)
Door spraaksyntese kan de computer ook antwoorden, of een geschreven
tekst uitspreken. Zo'n computerstem klinkt nu nog heel syntetisch, maar L&H
staat al redelijk ver met computerstemmen die het menselijk stemtimbre dicht
benaderen. De derde technologie, de kompressietechnologie, zorgt ervoor dat
de enorme hoeveelheid gegevens die spraak bevat, samengedrukt wordt, zodat
ze minder geheugenruimte inneemt.
,,We hebben al wel wat konkurrenten in elk van de drie technologieën waar
we mee bezig zijn,'' zegt Jo Lernout. ,,Maar onze grote troef is dat we de
drie technlogieën samen beheersen.'' De tweede grote troef is de
meertaligheid. L&H heeft al spraakherkenning in het Brits Engels, het Amerikaans
Engels, het Nederlands, het Frans, het Duits en het Italiaans. Chinees,
Arabisch en Japans zijn in ontwikkeling.
Met die drie technologieën gaat L&H naar vier markten. De automarkt,
computers en multimedia, telekommunikatie en konsumentenelektronika.
De L&H-technologie wordt al gebruikt in enkele honderden toepassingen.
,,De 65 kontrakten die we tot vandaag al afsloten, zitten mooi verspreid over
het rooster dat de drie technologieën en de vier markten vormen,'' zegt
Paul Hauspie. Alleen de markt van de konsumentenelektronika (een televisie
waar je aan kan vragen of er vanavond voetbal is) zal nog enkele jaren moeten
wachten op betaalbare toepassingen.