Tjänster
En speech recognition baserad applikation fungerar genom en människa-maskin dialog där användaren får höra information och styr systemet med språk. VoiceUserInterface (VUI) är kontaktskiktet av en speech recognition baserad applikation.Dess design måste vara noggrant konsturerad för att intelligent kunna täcka in funktionaliteter och samtidigt tillmötesgå användarens förväntningar. Affärsmodellen bestämmer i första stadiet ramen för automatiseringsprojekt. När det gäller automatisering med speech recognition baserade applikationer är det VUI som driver ROI då VUI i huvudsak ansvarar för användarens acceptans och upplevelse.
Då kvalitén på VUI är avgörande för att lyckas med en speech recognition baserad applikation erbjuder voiceandvision följande tjänster:
Requirements gathering och analys
- Kundtjänster (helpdesk, call center)
En logisk utgångspunkt för all VUI design är att analysera redan befintlig kundtjänst. Den befintliga kundtjänsten avslöjer viktig och avgörande information för att skapa en framtida språkapplikation. Övervakning och analys av dialoger med slutanvändaren ger viktig input för Sound & Feel definition och prompt design.
Med en VUI- designram i tanken analyserar voiceandvision interaktionen mellan kundtjänst och användaren för att sedan presentera en designstrategi. - Funktionalitet
Erfarenhet visar att den avsedda funktionaliteten som skall täcka framtida speech recognition baserade system ofta är konstruerade utifrån intern utveckling under längre tid och marknadsanknutna initiativ.
För att kunna anpassa den avsedda funktionaliteten till en speech recognition baserad applikation definierar voiceandvision noggrant uppgifterna för applikationen för att sedan utveckla dessa inom en VUI-kontext. - Infrastruktur och Back-end
Under tiden funktionaliteten definieras,framkommer när applikationen är beroende av back-end system och processrelaterad tillgänglighet av extern information. Typiska frågor att besvara:
Vad kommer tillbaka från databasen? Hur kan information göras direkttillgänglig på språkplattformen? Hur hanteras fördröjningar på back-end systemet? Hur handskas med lagring av stora mängder data som t ex ljudfiler?
voiceandvision utvärderar och undersöker teknisk genomförbarhet och infrastruktur för att kunna föreslå processer som verkliggör en optimal användar acceptans. - Business Requirements
Är det nödvändigt för systemet att kunna hantera en extensiv användarvolym för att göra det lönsamt? Parametrar som t ex pris per samtal eller per minut anger en tydlig utgångssituation. Till slut handlar voicebusiness om att hitta en vinstgivande lösning och samtidigt skapa en ‘added value’.
voiceandvision konsulterar sina kunder i utveckling och analys av affärsmål och finansiella modeller. - Användare
För att förverkliga användar-centrerad design är det avgörande att veta så mycket som möjligt om användaren. Typiska frågor kan vara vem som ringer,varför de ringer, när de ringer,hur de ringer,var de ringer ifrån, vad vill de och vad vet.
Med noggrann övervakning, skräddarsydda Wizard of Oz-tester och specialdesignade frågeformulär, undersöker voiceandvision slutanvändarnas profiler för att kunna skapa en användarcentrerad VUI design. - Marknadsföring och Corporate Identity
Varje företag har spenderat tid på att marknadsföra sig och sina produkter/tjänster. Samtidigt bildar kunderna sig en egen uppfattning av företaget de har att göra med, vare sig man planerar det eller inte.
voiceandvision ser till att VUI passar ditt företag och att Corporate Identity blir väl representerad i den nya kommunikationskanalen. - Teammedlemmar och partners
Under utvecklingen av ett språksystem behöver man bredvid VUI desigers specialister som ansvarar för infrastruktur, programmering och grammar-design. Vid varje språkprojekt uppstår problem som skall lösas.
Med professionell erfarenhet initierar och stödjer voiceandvision organisation och struktur av språkprojekt som leder till de rätta processer som behövs för att kunna fatta de mest effektiva och målinriktade beslut.
Sample dialogs & Wizard of Oz Test
Dialogstrategier, promptkompositioner, Sound & Feel måste alla testas med äkta användare i realistiska situationer. Varför ringer de upp ett voice recognition system? Att kontrollera och testa i ett tidigt koncept av möjlig dialogstrategi sparar pengar och tid.voiceandvision utför en professionellt förberedd och genomtänkt WoZ-test som ger viktig information i förhållande till vad som fungerar, kan fungera och vad som inte fungerar.
Designstrategi & skräddarsydd rekommendation
Att definiera designstrategin är följande logiska steg efter att ha samlat information om vad systemet kräver. Interimresultaten samlas och utvärderas samt skapar ramen för designfasen.voiceandvision presenterar en illustrativ provdialog och förklarar möjliga dialogstartegier och beslut angående design som är baserat på requirement gathering och analyser, äkta testdata och genomtänkt utvärdering.
Sound & Feel Definition
Kvalitén av VUI är delvis uppnådd av professionellt designad Sound & Feel som skapar en naturlig dialog mellan system och användare.”Idén är inte att lura användaren genom att låta dem tro att de talar med en levande människa utan att få dem att glömma att de talar med en maskin”
Fastän ”persona” är en central komponent av allmän Sound & Feel, är Sound and Feel mycket mer än bara ’persona”. Det omfattar hela uppfattningen en användare får när de interakterar med ett speech recognition baserad system.
voiceandvision skapar Sound & Feel definition som matchar designstrategin och som helt och hållet ligger i linje med data insamlad genom requirement gathering och analysfas.
Dialogdesign
Dialogdesignen återspeglar det logiska förloppet av interaktionen mellan människa maskin. Den förklarar systemets status. I vissa fall gör en intelligent dialogdesign det möjligt för användaren att utvecklas från nybörjare till ”power”-användare. En solid dialogdesign erbjuder information och support när behovet uppstår.Dialogdesignern överväger noga var barge-in tillåts och när det är befogat att använda ständigt aktiva kommandon.
voiceandvision garanterar en solid dialogdesign baserad på requirement gathering och analys, äkta testdata och gedigen utvärdering samt erbjuder kunden ett speciellt anpassat och detaljerat designdokument som enkelt kan användas av programmerare och systemintegrerare.
Promptdesign
Prompt design är kärnaktiviteten inom VUI design. Kompositionen av prompts måste vara extremt balanserad. Information måste arrangeras på ett logiskt sätt för att kunna möta användarens mentala modell. Dialogen måste initiera en konversationell karaktär, som liknar verbal kommunikation, som upplevs naturlig av användaren. Att tala med en maskin betyder inte automatiskt att man är tvungen att konversera på ett onaturligt sätt.
voiceandvision’s promptdesign skapas utifrån en genomtänkt dialog. Mänsklig verbal kommunikation blir analyserad och används.
voiceandvision förstår och respekterar skillnaden mellan skrivet och talat språk.
Inspelning & voicecoaching
Under inspelning ansvarar en voice-coach för att intentionerna med de nedskrivna prompterna blir korrekt inspelade. Mycket uppmärksamhet ägnas åt betoning och frasering. Konversationella aspekter kan enbart bli fastlagda under inspelning.voiceandvision stödjer och adviserar sin kunder med voice-casting och regisserar inspelnings sessionerna för att kunna garantera bästa möjliga övergång från skriven text till inspelade ljudfiler.
Postproduktion
Resultatet av inspelning är råmaterial där allt som skedde under sessionen är inspelat. Post produktion inleds med att noga selektera användbart material som allteftersom blir klippt och batch-processed genom olika filter för att optimera ljudkvaliten när prompts av CD kvalité (44.1 kHz) blir nedsamplade till telefonens audiokvalité (8 kHz). Tekniken som används för post produktion beror på röstkvalité och pitch samt på service karaktär och audiodesign.De inspelade promterna representerar den största delen av hela Sound & Feel i applikationen och har en avgörande roll för användaracceptansen och applikationens ROI.
För att kunna garantera en professionell standard kontrollerar voiceandvision alltid hela post produktionen.
Audiodesign
Klingande logos tilltalar lyssnarens fantasi och stimulerar olika processer i hjärnan. Ibland bidrar de även till att optimalisera minnesfunktioner. Ej talade audioelement kan ge en ren struktur. I vissa fall kan en väldesignad earcon (systemklang) ge mer information än ett talat meddelande. Audiodesign måste alltid ge added value. Att använda audioelement bara för sakens skull har inget syfte utan kan istället bli kontraproduktivt.
Med professionell expertis och gedigen erfarenhet överväger voiceandvision noga användningen av non-speech audio.
I de fall där designstrategin initierar användning av icke talad audio tillhandahåller voiceandvision kunden med väl designade och producerade miljöbakgrunder, jingles, landmarks och earcons.
Testing
Under utvecklingen av en språk applikation är det , som i alla projekt, viktigt att testa tidigt och ofta. Efter behovsanalysen testas dialogstrategin. Detta görs genom en Wizard of Oz-test. Resultatet av denna test indikerar om dialogstrategin fungerar, om den behöver tuning eller måste omarbetas. När fasen med dialogdesign är avslutad kan implementeringen påbörjas.Funktionalitets test- med temporära prompts eller TTS genererade prompts- ger implementeringen support. Efter inspelning och post produktion kan de inspelade prompterna bli implementerade. Systemet ”kommer till liv”och med de slutgiltiga prompterna testas systemet med tonvikt på acceptans och användarvänlighet. Kvalitativ och kvantitativ testdata samlas in genom intervjuer och frågeformulär. Log filer analyseras och tester ute på fältet genomförs. Detta för att skapa en tydlig bild av applikationens status.
Solid och frekvent testning filtrerar bort oregelbundenheter under utvecklingsfasen, ger support i processen och skapar möjligheter för korrigeringar i god tid samt sparar pengar.
Med professionell expertis och med speciellt anpassad metod initierar och organiserar voiceandvision testning av språkapplikationer.
Refinement Phase
Under testandet dyker detaljer upp som behöver uppmärksamhet. Grammars kanske måste anpassas för att uppnå en bättre speech recognition. Ibland är prompten inte optimal komponerad eller en paus är för lång. Oförutsedda back-end latencies måste tas omhand.voiceandvision ger kunden support genom hela projektet och tillhandahåller VUI relaterad service för att kreera bästa möjliga VUI
Marketing & Rollout Support
Ett beslut att automatisera med speech recognition baserad applikation kräver väl genomtänkt intern- och extern kommunikation. Av erfarenhet visar att det inte alltid är lätt att påpeka och förklara de fördelar av ett sådant system.
voiceandvision kommunicerar det essentiella från affärskunden till slutanvändaren och tillbaka igen och delar gärna med sig av projekterfarenheter.
voiceandvision arbetar nära kundens marknadsavdelning för att efficient kunna formge och stödja rolloutstrategin.