Leistungen
Applikationen, die auf Spracherkennung basieren, liegt ein Mensch-Maschine-Dialog zugrunde, bei dem der Anrufer Informationen akustisch wahrnimmt und das System mit gesprochenen Eingaben steuert. Das Voice User Interface (VUI) ist die Schnittstelle zwischen Anrufer und Sprachapplikation. Die Gestaltung dieser Schnittstelle muss sorgfältig durchgeführt werden, um auf intelligente Weise die erforderlichen Funktionen abzudecken und diese mit den Erwartungen der Anrufer in Einklang zu bringen. Zwar geben zunächst Business-Modelle den Rahmen für Automatisierungs-Prozesse vor, doch ist für die Akzeptanz beim Endkunden, und somit auch für einen schnellen Return of Investment, das VUI verantwortlich.Da der Erfolg von Sprachapplikationen in hohem Maße von der Qualität des VUIs abhängt, bietet voiceandvision folgende qualifizierte Dienstleistungen an:
Anforderungsanalyse
- Kundenbetreuung (helpdesk, call center)
Die gründliche Analyse jener Prozesse, mit denen unser Auftrageber bisher seine Kunden betreut, ist der Startpunkt für jedes VUI-Design. Sie liefert aus erster Hand eine Vielzahl an notwendigen Informationen und wichtigem Hintergrundwissen. Die Beobachtung und Analyse der Dialoge zwischen Anrufer und Kundenbetreuer geben wichtige Hinweise für spätere Designschritte.
Um den richtigen Ansatz für die grundlegende Design-Strategie zu ermitteln, analysiert voiceandvision die Interaktion zwischen Kundenbetreuung und Endkunden aus VUI-Sicht. - Funktionalität
Die Erfahrung zeigt, dass die Spezifikation einer zukünftigen Sprachapplikation oft über lange Zeit und viele interne Abteilungen hinweg gewachsen ist und aus Marketing-Gründen vorangetrieben wurde.
Um die vorgesehenen Funktionalitäten optimal innerhalb einer Sprachapplikation umzusetzen, definiert voiceandvision die Aufgaben der Applikation sorgfältig vor dem Hintergrund einer optimalen VUI-Qualität. - Technische Infrastruktur & Back-End Systeme
Die Funktionen einer Applikation genau zu definieren, erfordert genaue Kenntnis über Abhängigkeiten von Back-End Systemen und der prozessbedingten Verfügbarkeit von Daten. Typische Fragen in diesem Schritt sind: Was kann in der Datenbank gespeichert werden und welche Daten kommen zurück? Wie können sie der Sprachplattform zur Verfügung gestellt werden? Welche Latenzen können entstehen und wie soll damit umgegangen werden? Wo werden große Datenmengen, z.B. Soundfiles gespeichert?
voiceandvision untersucht und validiert die technische Machbarkeit und Infrastruktur einer zukünftigen Sprachapplikation, um ein optimales Anruferlebnis sicherzustellen. - Business-Anforderungen
Beim Einsatz von Sprachanwendungen sollen durch profitablen Lösungen Mehrwerte sowohl für den Betreiber als auch den Endkunden geschaffen werden. Dabei sind Fragen zu klären wie: Wie groß muss das Anrufvolumen sein, damit sich eine Sprachapplikation rechnet? Welches Billing-System (Minutenpreis oder Preis pro Anruf) macht am meisten Sinn?
voiceandvision berät seine Kunden bei der Analyse und Definition von Business Modellen und –Zielen. - Zielgruppe
Für das nutzerzentrierte Design einer Applikation muss ein klares Verständnis über die Eigenschaften und Verhaltensweisen der tatsächlichen Zielgruppe vorliegen. Allgemeine Annahmen reichen dabei nicht aus. Von Interesse ist beispielsweise: Wer ruft an? Warum wird angerufen? Wie häufig wird angerufen? Wie sprechen die Anrufer? Woher und womit wird angerufen? Was genau wollen die Anrufer? Wie informiert und geübt sind sie?
Mit reliablen Methoden zur Anrufanalyse, kundenspezifischen Wizard-of-Oz-Tests und speziellen Fragebogen- und Interviewtechniken erstellt voiceandvision genaue Endkunden-Profile als Ausgangspunkt des nutzerzentrierten Designs. - Marketing & Corporate Identity
Jede Firma investiert Zeit und Geld, um sich zu vermarkten. Zusätzlich entwickelt jeder Kunde ein bestimmtes Bild dieser Firma, das seine Kundenbeziehung prägt.
voiceandvision entwickelt das VUI passend zur Corporate Identity, um den Brand einer Firma erfolgreich in das neue Medium Sprachapplikation zu überführen. - Projektteam & Partner
Während der Entwicklung einer Sprachapplikation, gibt es neben den VUI Designern noch andere Spezialisten, die u.a. für die technische Infrastruktur, Programmierung und das Design der Grammatiken verantwortlich sind. Darüber hinaus muss in jedem Projekt eine intensive Kommunikation mit den Hersteller und Betreibern der Sprachplattform und des Spracherkenners stattfinden.
Auf Basis langjähriger professioneller Erfahrung initiiert und unterstützt voiceandvision die Organisation und Strukturierung von Voice-Projekten, um rechtzeitig Abhängigkeiten, Verantwortlichkeiten und Zeitpläne innerhalb eines Projekt-Teams zu klären. Dies ist eine wichtige Basis, für eine effiziente und effektive Zusammenarbeit.
Beispieldialoge & Wizard of Oz-Test
Bestimmte Dialogstrategien, Prompt-Kompositionen, der Sound & Feel und andere Designaspekte müssen mit echten Endkunden in einer natürlichen Anruf-Situation getestet werden. Das frühzeitige Überprüfen möglicher Dialogkonzepte spart Geld, Aufwand und Zeit und ist ein wichtiges Element in der VUI-Qualitätssicherung.voiceandvision führt professionelle WoZ-Tests durch und kann so zu einem frühen Projektzeitpunkt Auskunft darüber geben, welche Dialogstrategie und Designkonzepte funktionieren, welche funktionieren könnten und welche nicht.
Design Strategie & Individuelle Empfehlung
Die Definition der Design-Strategie ist der logische nächste Schritt nach erfolgter Anforderungsanalyse. Die gesammelten Daten und Ergebnisse werden evaluiert und bilden die Grundlage für alle weiteren Designentscheidungen. Diese können nun auf Basis solider Test-Daten getroffen und argumentiert werden. Innerhalb der Strategie-Definition werden alle Elemente, die zur einem gelungenen Anruferlebenis beitragen, eingehend bedacht, so z.B. die Fehlerbehandlung oder die Nutzung von Klängen und Hinweistönen.In der Individuellen Empfehlung präsentiert voiceandvision seinen Kunden aussagekräftige Beispieldialoge und erläutert mögliche Dialog-Strategien, die aufgrund profunder Anforderungsanalyse und Evaluation realer Testdaten zu empfehlen sind.
Sound & Feel Definition
Die Qualität eines VUIs wird durch einen professionell gestalteten Sound & Feel mitbestimmt.„Es geht nicht darum, Anrufer glauben zu lassen sie sprächen mit einem Menschen, sondern sie vergessen zu lassen, dass sie mit einer Maschine reden.“ ©
Obwohl die sog. Persona im Mittelpunkt des Sound & Feel steht, wird dieser noch durch viele andere Elemente bestimmt. Der Sound & Feel deckt alle Faktoren ab, die den Eindruck des Systems auf den Anrufer prägen, wie z.B. die VUI-Perspektive, ein Single- oder Multi-Persona-Ansatz, der Umgang mit Fehlern, die Art der Ansprache, Prosodie und Phrasierung und die Auswahl der Stimme bzw. des Sprechers.
voiceandvision erstellt eine Sound & Feel Definition, die sorgfältig auf die Design Strategie und die Ergebnisse der Anforderungsanalyse abgestimmt ist.
Dialogdesign
Das Dialogdesign gibt den logischen Ablauf einer Applikation wieder und deckt alle unterschiedlichen Dialogzustände und Randbedingungen ab. Intelligentes Dialogdesign ermöglicht dem Anrufer sich schnell vom Anfänger zum geübten Nutzer zu entwickeln, wobei das System ihm bei Bedarf zusätzliche Hilfe und Tipps bereitstellt. Der Dialogdesigner entscheidet im Vorfeld, an welchen Stellen und in welcher Weise „Barge-In“ und „always-active commands“ sinnvoll sind.voiceandvision garantiert ein solides Dialogdesign auf Basis gründlicher Evaluation aller Randbedingungen und stellt seinen Kunden ein detailliertes Dialogdesign-Dokument zur Verfügung, das den Programmierern und System-Integratoren als Vorlage zur Implementierung dient.
Promptdesign
Das Promptdesign, ist der Kern eines guten VUI-Designs. Die Ausgaben des Systems müssen genau aufeinander abgestimmt sein und Inhalte auf logische Weise gruppiert werden, so dass sie den mentalen Modelle der Anrufer entsprechen. Um den Dialog optimal zu gestalten, muss der Promptdesigner den späteren Dialogfluss bedenken und wie dieser in natürlicher Konversation stattfinden würde. Wenn Menschen mit einer Maschine reden, heißt das nicht, dass die sprachliche Interaktion unnatürlich ablaufen muss.
Im Promptdesign von voiceandvision behält auch der Mensch-Maschine Dialog den Charakter einer Konversation, um die gewohnten Kommunikationsmuster beim Anrufer hervorzurufen.
voiceandvision kennt und beachtet die Unterschiede zwischen gesprochener und geschriebener Sprache und analysiert menschliche Dialoge, um ein optimales VUI zu gestalten.
Sprachaufnahmen
Während der Aufnahme im Tonstudio ist es die Aufgabe des Voice Coaches, sicherzustellen, dass die Intention des Textes durch den Sprecher richtig erfasst und wiedergegeben wird. Betonung und Phrasierung müssen auf perfekte Verständlichkeit abzielen. Nicht nur akustisch, sondern auch semantisch muß ein Prompt vom Anrufer schnell erfasst werden können. Der Konversations-Charakter kann nur direkt in der Aufnahmesession erzeugt und kontrolliert werden.voiceandvision unterstützt seine Kunden bei der Auswahl von Sprechen (voice casting) und übernimmt das Voice Coaching während der Aufnahme, um die bestmögliche Umsetzung vom geschriebenen Text in eine lebendige Ansprache zu garantieren.
Nachbearbeitung der Aufnahmen
Das Ergebnis einer Aufnahmesession ist zunächst ein Berg von Rohaufnahmen, in denen alles, was während der Session stattgefunden hat, mit aufgenommen wurde. Aus diesem Material werden die besten Prompts sorgfältig herausgesucht, geschnitten und von CD-Qualität (44.1 kHz) auf Telefonie-Qualität (8 kHz) heruntergesamplet. Um einen bestmöglichen Klang zu gewährleisten und die Aufnahmen für die Übertragung über das Telefon zu optimieren, kommen verschiedene Filter und Dynamikprozessoren zum Einsatz. Die aufgenommenen Prompts stellen den größten Teil des bewusst von Anrufer wahrgenommen Sound & Feel dar und spielen dabei eine zentrale Rolle für Akzeptanz, Anruferlebnis und letztendlich ROI.Um professionelle Qualität und Standards zu garantieren, legt voiceandvision großen Wert darauf, den gesamten Aufnahme- und Nachbearbeitungsprozess selbst durchzuführen.
Audiodesign
Audio-Logos oder Jingles haben eine große Wirkung auf den Endkunden, da die akustische Wahrnehmung ganz andere Gehirnprozesse auslöst, als dies visuelle Reize tun. Klänge können die Phantasie anregen und Bilder im Kopf erzeugen und zur besseren Erinnerung von gehörter Information beitragen. Nicht-sprachliche Klangelemente können zur Strukturierung einer Sprachapplikation beitragen und die Navigation verbessern. Ein gutes Earcon (kurzes akustisches Zeichen) kann in manchen Fällen bessere Hinweise als eine gesprochene Information geben. Grundsätzlich muss geprüft werden, wann und in welcher Weise der Einsatz von Audio-Elementen Mehrwert schafft. Der unüberlegte Einsatz von Klängen kann kontraproduktiv sein, deshalb sollte ihr Einsatz immer genau abgewogen werden.voiceandvision evaluiert für seine Kunden den Einsatz von nicht-sprachlichen Klangelementen auf Basis von professioneller Expertise und weitreichenden Erfahrungen auf diesem Gebiet. In Übereinstimmung mit der Design-Strategie produziert voiceandvision ein individuelles Klangbild aus Sound-Atmosphäre, Earcons, Jingles und anderen Systemklängen.
Testen
Wie in jeglicher Art von professioneller Produktentwicklung, ist es auch im Bereich von Sprachapplikation sehr wichtig, häufig und möglichst frühzeitig zu testen. Mit einfachen Wizard of Oz-Tests (eine Person “spielt” das System) können nach Abschluss der Anforderungsanalyse die ersten Konzepte für verschiedene Dialogstrategien ausprobiert und evaluiert werden. Ist das Dialogdesign festgelegt, kann mit der Implementierung begonnen werden, die durch funktionales Testen auf Basis von TTS oder Probeaufnahmen unterstützt wird. Wenn die Sprachaufnahmen gemacht sind und die finalen Prompts implementiert sind, können ausführlichere Tests auf Benutzerfreundlichkeit und Akzeptanz durchgeführt werden. Reliable Testmethoden auf Basis empirischer Methoden und Statistik, wie z.B. standardisierte Interviews, Fragebögen, Feldtests etc. sind essentiell, um aussagekräftige Ergebnisse zu erhalten. Log File-Untersuchungen und andere quantitative Testmethoden ergänzen das vollständige Bild einer Applikation. Durch professionelles und häufiges Testen können die meisten Probleme entdeckt und noch während der Entwicklungsphase durch geeignete Korrekturmaßnahmen behoben werden. Dies spart nicht nur den erheblichen finanziellen Aufwand von Redesignmaßnahmen in einem bereits veröffentlichten System, sondern schützt unsere Kunden davor, mit einer fehlerhaften Applikation in den Markt zu treten.voiceandvision initiert, organisiert und führt verschiedene Testverfahren durch, um den Entwicklungsprozess zu unterstützen, und eine optimale VUI-Qualität sicherzustellen.
Tuning
Während des Testens werden viele Details zum Vorschein kommen, die korrigiert oder verbessert werden müssen. In der Regel müssen beispielsweise Grammatiken erweitert und verfeinert werden, um die Erkennungsrate zu erhöhen. Bestimmte Formulierungen in Systemausgaben können verständlicher formuliert werden , Pausen zwischen Prompts müssen gekürzt oder verlängert werden. Latenzen des Back-Ends müssen in der Praxis überprüft werden und ggf. durch Audio-Elemente oder entsprechendes Prompting abgedeckt werden. In dieser sehr wichtigen Phase müssen das Testen und Korrigieren auf VUI- wie auch Implementierungsseite Hand in Hand gehen.voiceandvision unterstüzt seine Kunden während der gesamten Projektdauer und stellt seine Dienstleistungen für alle VUI-verwandten Themen zur Verfügung.
Marketing & Markteinführung
Die Entscheidung, Business-Prozesse über eine Sprachapplikation zu automatisieren verlangt eine optimale Vorbereitung und Durchführung der internen und externen Kommunikation. Die Erfahrung zeigt, dass Firmen oft unvorbereitet und nicht ausreichend über ihre eigenen Systeme informiert sind, um die Vorteile einer Sprachapplikation dem Endkunden und den eigenen Mitarbeitern gegenüber argumentieren zu können.voiceandvision gibt seine weit reichenden Erfahrungen in der Markteinführung von Sprachdialogsystemen gerne an seine Businesskunden weiter. Wir unterstützen frühzeitig das Marketing um die optimale Strategie der Kundenkommunikation schon vor der Markteinführung zu ermitteln.