Sprechen statt Tippen: Diktieren am PC
Sprachsoftware: Naturally Speaking gegen Windows Vista
Software
Es funktioniert. Aber es nervt. Weil es noch zu viele Fehler macht. So lautete, grob gesprochen, das Fazit des Praxistest der Spracherkennung Dragon Naturally Speaking 9 Preferred von Nuance. Die Erkennungsraten bewegten sich anfangs um die 90 Prozent, nach Korrektur waren ungefähr 95 Prozent möglich. In diesem Test geht es darum, wie sich das Programm im Alltag bewährt und welche Optimierungsmöglichkeiten es bietet. Außerdem hat sich die netzwelt-Redaktion das Spracherkennungsmodul in Windows Vista angesehen - und dabei eine handfeste Überraschung erlebt.
Inhalt
- Vokabularanalyse in Naturally Speaking
- Probleme beim Diktieren
- Tools verbessern die Erkennung
- Formatieren, Navigieren, Desktop steuern
- Tipps für bessere Performance
- Spracherkennung in Windows Vista
Vokabularanalyse
Erste und wichtigste Maßnahme zur Verbesserung der Erkennungsrate ist die Analyse bereits vorhandener Texte. Der Anwender muss dazu nur den Pfad angeben, in dem die fraglichen Dokumente liegen. Die Software durchsucht die Texte dann nach unbekannten Vokabeln und präsentiert diese in einer Liste. Daraus wählt man diejenigen, die ins Benutzerwörterbuch sollen, und trainiert jeweils die Aussprache.
Generell ist beim Hinzufügen und Trainieren neuer Wörter zu beachten, dass alle Beugungen eines Worts einzeln zu trainieren sind, also: "Hersteller, Herstellers, Herstellern." Die Prozedur nimmt einige Zeit in Anspruch, belohnt aber später durch bessere Erkennung beim Diktieren.

![]()
![]()
In der Dokumentanalyse sucht Naturally Speaking nach unbekannten Vokabeln und passt sich so dem Schreibstil des Anwenders an.
Probleme beim Diktieren
Die Erkennungsraten werden in diesem Test aber nicht mehr ermittelt. Da sie mit der Länge des diktierten Dokuments und dem Anteil unbekannter Wörter stark schwanken, ist eine Angabe der Werte in Prozent nicht sinnvoll. Als Faustregel lässt sich festhalten, dass ein einigermaßen eingespieltes Programm auf eine Erkennungsrate von circa 95 Prozent kommt. Das wiederholte Training hilft, neue Wörter hinzuzufügen und die Erkennung bereits bekannter zu stabilisieren. Aber unbekannte Wörter, Abkürzungen und Eigennamen sind immer ein Problem. Das zeigt sich auch im Praxistest. Die Leistung der Diktiersoftware schwankt zwischen erstaunlich gut bei Texten mit bekanntem Vokabular und miserabel bei Passagen mit neuem Wortschatz.
Ein zunehmendes Problem für Spracherkennung sind die zahlreichen Anglizismen, die in den letzten Jahren in die deutsche Sprache Einzug gehalten haben. Modewörter wie shoppen, browsen, chillen oder Lounge müssen alle trainiert und dem Wortschatz hinzugefügt werden. Auch Fachausdrücke bedürfen des Trainings. Das macht die Einarbeitungsphase in Naturally Speaking zu einer langwierigen Angelegenheit.
Probleme hat Dragon außerdem häufig mit Groß- und Kleinschreibung, mit zusammengesetzten Wörtern (Komposita) und mit Wörtern, die mit Bindestrich verbunden sind, also mit allem, was sich nicht über die Aussprache erkennen lässt. Auch Pronomen (er, es, sie, ihn, ihm), Artikel (die, die, das) oder Endungen machen Naturally Speaking zu schaffen, eigentlich alles, was aus nur einer Silbe besteht. Diese kurzen Wörter geben dem Erkennungsalgorithmus einfach zu wenig akustische Informationen. Umgekehrt gilt, dass lange Wörter mit drei oder mehr Silben ausgesprochen zuverlässig erkannt werden.
Jetzt sind Sie dran.
Kommentieren
nach oben




