Voice User Interface
Das Hörerlebnis des Anrufers ist entscheidend für die Akzeptanz und damit für den Erfolg von IVR-Sprachportalen.
Christian Sauter, Excelsis Vorstand
Professionelles VUI-Design
Das Voice User Interface (VUI) oder auch Audio User Interface ist die Schnittstelle zum telefonischen Self Service. Dem VUI kommt eine entscheidende Bedeutung für die Akzeptanz von Sprachportalen zu, denn letztlich entscheidet das Hörerlebnis über den Erfolg einer Sprachanwendung. Eine entsprechend hohe Aufmerksamkeit muss diesem Thema gewidmet werden.
Unser Dialog-Design stammt aus der Feder erfahrener Computerlinguisten, Linguisten und Psychologen. Für Sprachaufnahmen, die Produktion von Musik, Geräuschen, Audiologos, Navigationssignalen und Soundeffekten nutzen wir unser High Tech-Tonstudio.

Unsere Partner und Kunden erhalten bei uns alles aus einer Hand auf Basis einer bewährten Methodik.
Sound Beispiele
| Intros |
| Klangwelten |
| Earcons |
| Music on Hold |
Linguistik
- Ausarbeitung der “Persona” als Grundlage für Dialog-Design, Texting und Audioproduktion sowie Erstellung des Dialog-Designs
- Ausarbeitung eines detaillierten Dialogflusses
- Test dieses Dialogflusses mit der Zielgruppe
- Ausformulierung von hörergerechten Texten
Phonetik
- Erstellung, Test und Optimierung von Grammatiken
- Erstellung und Test von Transkriptionen
- Einsatz und Bereitstellung umfassender Tools und Checklisten
Audioproduktion
- Koordination von Sprecher/in (“Voice Talent”) und Sounddesigner
- Casting, Auswahl und Coaching auf Basis “Persona”-Konzept
- Nachbearbeitung und Optimierung der Aufnahmen
- Erstellung von Klangwelten (Jingles, Töne, Geräusche)
- Formatkonvertierung von Audiodaten
Excelsis Natural Dialog Management
Unter Natural Dialog Management wird bei Excelsis der Einsatz verschiedener Technologien und Methoden verstanden, um mittels Spracherkennung und Interaktion einen möglichst natürlichen Dialog mit dem Anrufer zu erreichen.
Natural Dialog Management umfasst dabei sowohl die Eingaben des Anrufers als auch die Ausgaben der Sprachanwendung. Bei den Eingaben des Anrufers kommen z.B. Technologien wie Barge-In, regelbasierte oder statistische Grammatiken sowie globale Steuerbefehle (sogenannte Universals) zum Einsatz. Darüber hinaus werden Multi-Slot-Eingaben für komplexe Eingabeformulare mit einem sogenannten Mixed-Initiative-Dialog kombiniert, um sehr freie Eingaben auf Eingabeaufforderungen des Systems zu ermöglichen.
Die Natürlichkeit des Dialoges kann weiter erhöht werden mit N-best Processing für die Verbesserung der Erkennung bei phonetisch ähnlichen Begriffen und Implicit Correction für die Korrektur implizit bestätigter Begriffe.
Bei den Ausgaben des Systems wird hoher Wert auf eine natürliche Aussprache gelegt, egal ob diese über Audio-Prompts oder per TTS erfolgen. Hierzu kommt eine Natural Pronunciation Formatting Technology für dynamische Daten zum Einsatz.
Über die Adapt-to-Caller Methode kommt das System den Aussprachegewohnheiten des Anrufers entgegen und erhöht somit die Verständlichkeit und verbessert das Anruferlebnis deutlich. Beispiel: Bei Angabe von Ziffernfolgen wie PLZ versteht das Sprachportal alle Eingabeformen, Ziffer für Ziffer oder in Varianten ausgesprochen wie “siebzig einhundertzweiundachtzig”. Excelsis Sprachportale verstehen solche Eingaben und geben die Angaben genau so als Sprachausgabe wieder.
Kontext-sensitive Hilfen und Random Prompting runden das Erscheinungsbild des Sprachdialogsystems bzw. Sprachportals ab.




