Taligenkänning är tekniken som gör det möjligt för datorer att uppfatta, förstå och tolka mänskligt tal. I sammanhanget voicebots används taligenkänning för att omvandla det som en person säger i telefon till text, så att systemet kan analysera innehållet och agera på det i realtid.
Det första steget i ett samtal med en voicebot är alltid att ljudströmmen från samtalet tolkas och omvandlas till text (tal-till-text). Denna text bearbetas sedan med hjälp av språkförståelse, ofta kallat NLP (Natural Language Processing). NLP gör det möjligt för systemet att identifiera intentioner, nyckelord och sammanhang i det som sägs, till exempel vad ärendet gäller eller vilken åtgärd som ska utföras. Utifrån denna tolkning kan algoritmer fatta beslut, hämta information, ställa följdfrågor eller utföra uppgifter.
Taligenkänning används även inom många andra områden, till exempel för att diktera journalanteckningar inom vården, styra digitala assistenter eller skapa text från möten och intervjuer. Samma grundläggande teknik ligger även till grund för voicebots: att korrekt förstå vad en människa säger är en förutsättning för att kunna föra ett meningsfullt samtal.
Taligenkänning är därmed en central byggsten i alla voicebot-lösningar och möjliggör automatiserad, tillgänglig och effektiv service via telefon – dygnet runt.