Talegjenkjenning er teknologien som gjør det mulig for datamaskiner å oppfatte, forstå og tolke menneskelig tale. I sammenheng med voicebots brukes talegjenkjenning til å omgjøre det en person sier i telefonen til tekst, slik at systemet kan analysere innholdet og svare i sanntid.
Det første steget i all samhandling med en voicebot er alltid å tolke lydstrømmen og gjøre den om til tekst (tale-til-tekst). Denne teksten behandles deretter ved hjelp av språkteknologi, ofte kalt NLP (Natural Language Processing). NLP gjør det mulig for systemet å identifisere intensjon, nøkkelord og kontekst i det som blir sagt – for eksempel hva henvendelsen gjelder eller hvilken handling som skal utføres. Basert på denne tolkningen kan algoritmer ta beslutninger, hente informasjon, stille oppfølgingsspørsmål eller utføre oppgaver.
Talegjenkjenning brukes også innen mange andre områder, som diktering av journalnotater i helsesektoren, styring av digitale assistenter eller konvertering av møter og intervjuer til tekst. Den samme grunnleggende teknologien ligger også til grunn for voicebots: å forstå hva et menneske sier er en forutsetning for å kunne føre en meningsfull samtale.
Talegjenkjenning er dermed en sentral byggestein i alle voicebot-løsninger og muliggjør automatisert, tilgjengelig og effektiv kundeservice via telefon – hele døgnet.