Diese Technologie verwandelt gesprochene Sprache in geschriebenen Text. Sie wird in Diktierprogrammen, Untertitel-Generatoren oder zur Sprachsteuerung verwendet. STT-Systeme verbessern sich stetig durch maschinelles Lernen, sind aber bei Dialekten oder Hintergrundgeräuschen noch fehleranfällig.