Offline-Spracherkennung

Aus der Mikrocontroller.net Artikelsammlung, mit Beiträgen verschiedener Autoren (siehe Versionsgeschichte)
Wechseln zu: Navigation, Suche

Spracherkennung ohne Cloud, englisch speech recognition oder speech-to-text (STT).

Oft wird keine echte Spracherkennung benötigt, also Diktat von freiem Text, sondern es reichen wenige vorher festgelegte Sprachbefehle, auch Sprachsteuerung genannt, engl. intent (z.B. Licht an, Jalousien herunterfahren).

Daneben gibt es noch das Aktivierungswort um die Spracherkennung aufzuwecken engl. wake-word (z.B. Hey Mercedes). Die nötige Rechenleistung muss gering sein und oft wird die Funktion offline auf dem Endgerät ausgeführt, teilweise von einem spezialisierten Prozessor. Wikipedia:Aktivierungswort

Theoretische Grundlagen gibt es auf Wikipedia:Spracherkennung.

Sprachassistenten für Raspberry Pi[Bearbeiten]

Natürlich lauffähig auf jedem Linux-System.

Windows-Software[Bearbeiten]

  • Windows Spracherkennung (Start -> Einstellungen -> Sprecherkennung)
  • Dragon NaturallySpeaking (Wikipedia)

Hardwaremodul[Bearbeiten]

Hardwaremodule in Form von ICs oder Libraries für Controller bieten meist nur vorher definierte Sprachbefehle.

Open-Source[Bearbeiten]

Siehe auch[Bearbeiten]