Sprachsoftware: Naturally Speaking gegen Windows Vista

Tools verbessern die Erkennung

Eine Optimierungshilfe bringt das Erkennungscenter. Dort kann der Nutzern nicht nur die Signalqualität des Mikros prüfen, sondern auch eine Optimierung des Sprachmodells starten. Dabei geht es weniger um neuen Wortschatz als um die Art, wie der Anwender Wörter ausspricht und seine Sätze baut.

Erkennungscenter Dragon Naturally Speaking
Der Besuch im Erkennungscenter lohnt sich. Dort findet sich eine Reihe von Features zur Optimierung des Programms.

Sehr lobenswert ist ein Internet-Service, den Hersteller Nuance registrierten Nutzern anbietet. Da kann man ein benutzerdefiniertes Vokabular erstellen lassen. Dazu muss man zuerst seine gesammelten Sprachdaten via Internet übertragen und erhält diese nach einiger Zeit wieder zurück. Laut Hersteller soll dies die Erkennungsgenauigkeit nochmal spürbar steigern.

Werbung
Dragon Naturally Speaking Internet-Features
Internet-Service: Im Labor von Nuance wird das Benutzervokabular analysiert, mit seinem Sprachstil kombiniert und optimiert.

Formatieren, Navigieren, Desktop steuern

Schnell gewöhnt hat man sich an die wichtigsten Befehle des Programms. "Streich das" löscht die zuletzt diktierten Wörter. Die Befehle "Geh schlafen" und "Wach auf" schalten das Mikrofon in den Stand-by-Modus und wieder ein. Noch praktischer ist es allerdings, die Plustaste auf dem numerischen Zahlenblock als Ein-/Aus-Schalter zu verwenden. Das Diktieren von Zahlen funktioniert sehr zuverlässig. Auch große Zahlen schreibt Naturally Speaking korrekt auf.

Doch Spracherkennung ist ja nicht nur zum Diktieren da. Während des Diktats kann der Nutzer den Text gleich formatieren, indem er zum Beispiel sagt: "Mach das fett". Das Navigieren im Dokument geht mit Befehlen wie "Zum Zeilenanfang/Zeilenende". Zudem kann man den Desktop steuern, also Programme öffnen und schließen, zwischen Programmen wechseln oder sich durch Menüs hindurchhangeln. Das Navigieren per Sprachbefehl ist im Test aber spürbar langsamer und träger als mit der Maus.

Bei der Befehlssteuerung ist die Fehlerquote im Test schon ziemlich hoch. Beispielsweise erkennt das Programm den Befehl "Formatier das fett" als Texteingabe und überschreibt damit die vorher eingegebenen Wörter. Das passiert im Test mehrmals, sodass man schnell die Lust verliert. Erst nach dem Training der Befehle läuft es besser. Für Einsteiger ist es daher zweckmäßig, sich erst mal aufs Diktieren von Text zu beschränken, und die anderen Möglichkeiten wie Buchstabieren, Texte formatieren oder gar das Steuern von Menüs und Desktops zunächst außen vor zu lassen, beziehungsweise erst langsam zu erarbeiten.

Dragon Naturally Speaking
Traum jedes Anwenders: Unterwegs ins Diktiergerät sprechen und Naturally Speaking zaubert daraus einen fertigen Text. Das Lernprogramm zeigt, wie das geht.

Tipps für bessere Performance

Sprachbefehle benötigen eine höhere Verarbeitungsleistung als die Texterkennung. Sinnvoll ist es daher während des Diktierens bestimmte Features abzuschalten. Das Programm muss dann nicht mehr selbst zwischen den verschiedenen Modi Diktieren, Buchstabieren, Zahlen oder Befehlssteuerung unterscheiden. Diese Unterscheidung beansprucht Rechenzeit und kann Fehler produzieren. Wenn man aber unter "Optionen/Befehle" die Features "Befehle bei HTML-Anzeige" (Sprachsteuerung im Internet Explorer) sowie "Mausbewegungsbefehle" deaktiviert, schränkt das die Auswahl ein und der Erkennungsalgorithmus kann sich schneller an die Arbeit machen. Die Möglichkeit, die Maus per Sprachbefehl über den Bildschirm zu schubsen, ist sowieso nur für Anwender mit gesundheitlichen Problemen interessant.

Im Menü "Extras" kann der Anwender einen Regler zwischen den Polen "schnellste Erkennung" und "höchste Genauigkeit" verschieben. Im Test zeigt sich aber, dass die höchste Genauigkeit die Performance spürbar bremst. Auf dem Testrechner mit Intels 3,4 GHz-Pentium-CPU und zwei Gigabyte Arbeitsspeicher arbeitete das Programm in dieser Einstellung sehr langsam.

Wenn die Software während des Diktats plötzlich sehr träge reagiert, hilft es, mit der Plustaste auf dem numerischen Tastenblock das Mikro kurz aus- und wieder einzuschalten.

Fazit: Naturally Speaking ist trotz intuitiver Bedienung ein umfangreiches und leistungsstarkes Programm, das für optimale Produktivität eine gewisse Einarbeitungszeit benötigt. Ob sich der Einsatz lohnt, entscheiden letztlich die Texte, die man damit schreiben will. Je vielfältiger der Wortschatz, je mehr Eigennamen und je höher der Anteil neuer Vokabeln, desto mehr Fehler treten auf. Die Ideallinie für das produktive Arbeiten mit der Spracherkennung liegt irgendwo zwischen dem Serienbrief für Geschäftspartner und Günter Grass' "Blechtrommel".

Forum

Eigenen Kommentar schreiben