IBM heeft patent aangevraagd op een nieuwe vorm van spraaksynthese. Met
hun nieuwe techniek spreekt de computer met kleine haperingen en korte pauzes.
Net als echte mensen doen.
Onderzoekers van IBM hebben een nieuwe methode van spraaksynthese ontwikkeld.
Dankzij deze methode spreekt de computer met een stem die zo natuurlijk klinkt
dat hij nauwelijks van een menselijke stem is te onderscheiden. Dit komt
door de toevoeging van kleine haperingen, kuchjes en pauzes in de
computerspraak. IBM heeft de nieuwe technologie onlangs gepatenteerd onder
de ingewikkelde naam "generating paralinguistic phenomena via markup in
text-to-speech syntheses".
Sst, de computer is aan het woord
Tegenwoordig kom je regelmatig met sprekende computer in aanraking.
Denk bijvoorbeeld aan een telefonische klantenservice of aan het
navigatiesysteem in de auto. Vaak klinkt de computerspraak daar nog verre
van menselijk. De zin is meestal wel goed verstaanbaar, maar de intonatie
laat vaak nog te wensen over. De spraak klinkt monotoon en waar wij even
een pauze zouden inlassen, spreekt de computer op volle vaart door. Met de
nieuwe methode klinkt de computerspraak juist heel natuurlijk.
Volgens Andy Aaron, onderzoeker bij IBM, kan de nieuwe techniek een groot
verschil maken. In de Britse krant The Telegraph legt hij uit: "De
effecten kunnen heel subtiel zijn, soms zelfs onhoorbaar, maar ze hebben een
groot psychologisch effect." Zo zegt de computer af en toe 'uh' om te
laten blijken dat hij nadenkt en zucht hij zo nu en dan om te laten zien dat hij
zijn best doet. Ook kan hij kuchen als je je aandacht erbij moet houden en
zelfs 'sst' zeggen als je niet door hem heen moet praten.
Het is niet de bedoeling om computerstemmen zo menselijk te maken dat ze niet
meer van echte stemmen te onderscheiden zijn, vertelt Andy Aaron. "We
hebben dat punt nu wel bijna bereikt, maar we willen niemand voor de gek
houden." De nieuwe techniek is dus alleen ontwikkeld om de communicatie
tussen mens en computer soepeler te laten verlopen. Er is zelfs een
formule ingebouwd waarmee de computer zelf nieuwe uitdrukkingen kan leren en ze
op het juiste moment gebruikt.
Iedere taal heeft zijn eigen manier om aan te geven dat je even nadenkt of om
de aandacht van je gesprekspartner te trekken. IBM heeft de nieuwe
techniek alleen voor het Engels ontwikkeld; het is dus nog niet toe te passen in
het Nederlands. De markt heeft wel oren naar de nieuwe methode. Mark
Gretton van TomTom zegt in The Telegraph: "Het kan zeker een waardevolle
toevoeging zijn om non-woorden te gebruiken om gestreste chauffeurs te helpen
herinneren op tijd af te slaan, of eenvoudigweg om op te letten."