Stemmegrensesnitt – Hvordan, hvor og når kommer det til å slå an? (del 2)

John Ekman

Dette er del 2 i serien vår om stemmegrensesnitt. Hvis du har lest del 1, så er du kanskje – i likhet med meg – overbevist om at stemmegrensesnittet vil bli den tredje digitale revolusjonen. Jeg lovet også å fortelle HVOR og i HVILKE SITUASJONER forbrukerne kommer til å velge stemmegrensesnitt. Hyggelig at du er tilbake, for nå er det nettopp det vi skal prate om.

Aller først: Stemme passer ikke til alle typer spørsmål og interaksjoner.

«OK Google – velg en ny bil til meg»
– «Alexa – gi meg litt inspirasjon til en flott reise neste juleferie»

Vel, det kommer til å ta tid før vi får se det, om noensinne.

Men det betyr ikke at vi kan avfeie stemmegrensesnitt, bare fordi det finnes bestemte situasjoner og kontekster det ikke fungerer i. Det handler om å finne de tilfellene hvor det kommer til å fungere veldig bra. Hva er så det?

En motorvei med to filer mot suksess

Jeg pleier å se for meg de digitale interaksjonene våre som en motorvei med to filer. Begge to er både bra og vellykkede – de er bare helt forskjellige.

1 – Blow my mind

I det ene kjørefeltet prøver vi å forbause publikummet vårt. Vi viser dem ting de ikke kunne ha forestilt seg, ikke en gang i sine villeste fantasier. Ting går viralt og folk blir målløse. Dette sporet har alltid vært favorittsporet til markedsførere som elsker å være kreative og tenke «outside the box».

2 – Get shit done

Til markedsførernes store forferdelse, så er forbrukerne som regel bare opptatt av å «Get shit done». Sånne ting som å handle mat, betale regninger, melde barna på fritidsaktiviteter, melde barna av fritidsaktiviteter man nettopp betalte masse for og så videre. Det er her stemme kommer til å regjere.

Hvis du er ute etter å forbause publikummet ditt – fortsett å satse på video og storslåtte visuelle presentasjoner. Hvis du tror at kundene kommer til deg for å få løst det såkalte livspuslespillet – sats på stemme.

«Hvis du tror at kundene kommer til deg for å få løst det såkalte livspuslespillet – sats på stemme.»

Psst … Ikke gå glipp av frokostseminaret vårt i Stockholm 31. januar og i Göteborg 20. februar. Der får du vite alt du trenger å vite om den neste digitale revolusjonen – stemmegrensesnitt.

FAANG – viser vei

La oss hente litt inspirasjon fra de største tech-forbildene våre: Facebook, Apple, Amazon, Netflix og Google. Handler de først og fremst om «Blow my mind» eller «Get shit done»?

Facebook

Det er lett å tenke «Blow my mind» her, siden Facebook er en evigvarende strøm av kattevideoer og andre flotte greier det forventes at vi klikker på. Men når man tenker på selve tjenesten i seg selv, så handler det jo om å  komme lett i kontakt med andre mennesker. Man kan melde seg inn i grupper for å finne likesinnede, opprette events, delta på events og selge ting på Marketplace. Da stemmer det nok kanskje bedre å plassere Facebook i «Get shit done»?

Apple

Apple er jo nødt til å være det ultimate «Blow my mind»-selskapet, med alle de geniale produktene deres. Men igjen – ser vi bort ifra selve produktdesignet, så ser vi at Apple har gjort mye for å knytte brukerne sine til et økosystem av brukervennlige tjenester og programvare. Klokken er koblet sammen med telefonen, som er koblet sammen med dataen, som er koblet til iPaden, som er koblet til iCloud. Alt skal være enkelt å bruke og nesten umulige å forlate. Det kan man vel kalle et perfekt økosystem for «Get shit done», ikke sant?

Amazon

Jeg har beskrevet Amazon i andre blogginnlegg, hvor jeg kaller Amazon for «verdens mest friksjonsfrie økosystem». Definitivt «Get shit done».

Netflix

Netflix ligner litt på Facebook på den måten at innholdet er «Blow my mind», men måten det brukes på og får deg til å konsumere innholdet deres om og om igjen, det faller snarere inn under «Get shit done».

Google

Google – The place to get shit done. Mer trenger man ikke si.

Når man ser nærmere på verdens mest fremgangsrike tech-selskaper, som vi tradisjonelt sett gjerne betrakter som kule «Blow my mind»-selskaper, så virker det faktisk som om de har bygget store deler av sin suksess i «Get shit done»-sporet.

Og som ved en tilfeldighet, så satser i hvert fall tre av disse selskapene stort på stemmegrensesnitt.

Stemmegrensesnitt – raskere, enklere, samtidig

La oss sammenligne stemmegrensesnitt med tekstgrensesnitt (a.k.a. tastaturet på dataen)

1 – Raskere

Stemme er nesten fire ganger så raskt som tekst. Vi kan prate 150 ord i minutter, sammenlignet med 40 ord i minuttet når vi skriver.

2 – Enklere

Å prate krever mindre kognitiv innsats enn å skrive. Selv om vi kunne ha skrevet like raskt som vi prater, så hadde det fremdeles vært vanskeligere for hjernen å skrive. Ved å prate reduserer vi altså belastningen på en allerede overbelastet hjerne. Fint, ikke sant?

3 – Multitasking

Når vi bruker stemmen vår, kan vi gjøre andre ting samtidig som vi prater. Vi kan lage mat, løfte opp barn som har falt, ta ut av oppvaskmaskinen, kjøre bil. Mye forskjellig som bare krever hendene våre mens resten går på autopilot i hjernen vår. Kanskje er det nettopp derfor barnefamilier er overrepresentert blant brukerne av Amazon Alexa i USA?

Støy og andre mennesker


Ser vi på hva som hindrer oss i å bruke stemmen, så er det først og fremst to ting:

1 – Støy

Uoversiktlige lydmiljøer med bakgrunnslyd, musikk og andre mennesker som prater, gjør det mye vanskeligere for stemmetjenestene å gi et korrekt resultat.

2 – Andre mennesker

I det daglige er nok det største problemet med å bruke stemmen at det oppleves som «sosialt uakseptabelt» å holde på med tingene sine når det er andre mennesker i nærheten.

Let’s get to the point


Nå har vi listet opp en rekke fordeler og ulemper med stemmegrensesnitt. Det er på tide å komme frem til sluttpoenget: Når, hvordan og hvor kommer det til å fungere? Jeg har tenkt litt frem og tilbake, og jeg har kommet frem til at stemme vil bli en slager i situasjoner og kontekster som karakteriseres av følgende fire faktorer:

1 – Ting du ikke trenger å se

Stemme fungerer bra når vi handler eller undersøker ting som vi ikke trenger å se. Det meste av dagens shopping og opplevelser på nett, er sentrert rundt den visuelle opplevelsen. Men vi vet allerede hvordan mye av det vi kjøper ser ut, eller så er det andre faktorer enn utseende som er avgjørende for oss.

2 – Vanesaker

En underkategori av ting vi ikke trenger å se, er de tingene vi kjøper av gammel vane. Når jeg vet hvordan en økologisk banan ser ut, så trenger jeg ikke se bananen. Det holder at stemmeassistenten min spør meg: «Hvor mange økologiske bananer vil du kjøpe?».

3 – Multitasking

Vi kan prate når vi gjør ting på autopilot, og vi forsøker hele tiden å effektivisere «livspuslespillet» vårt. Derfor vil det bli veldig attraktivt å for eksempel kunne handle mens vi holder på med andre ting med hendene våre.

4 – Lukkede miljøer

Siden «støy og andre mennesker» spenner bein på teknologien og våre sosiale liv, så kommer stemmegrensesnittet til å fungere bra når vi kan stenge ut annen lyd og slippe å være flaue rundt andre mennesker.

Din utfordring – finn en kontekst

Nå har du fått fire ledetråder til når stemmegrensesnitt kan fungere veldig bra, så her får du en utfordring:

  • Hent en kopp te, kaffe eller noe annet du har lyst på
  • Tenk gjennom de fire ledetrådene
  • Prøv deretter å finne en kontekst/situasjon eller et bruksområde som bygger på de fire ledetrådene

Når du er klar kan du spille av videoen nedenfor.

Kommer vi frem til det samme?

Se også disse blogginnleggene