Hallo, erstmal hoffe ich, dass ich hier im richtigen Unterforum bin, aber zum Thema: Ich beschäftige mich gerade mit neuronalen Netzen und da frage ich mich, ob und wie gut eine Spracherkennung mit dem Pi umzusetzen ist, es geht nur um wenige Wörter (ca. 20). Ich will damit, auch wenn es hier jetzt erstmal nicht relevant ist, eine "Alexiri nano" umsetzen, so will ich meine Projekte steuern können, bspw.sage ich: "Alexiri, Uhr", dann soll sie mir die Uhrzeit ansagen (das vorlesen würde ich dann mit espeak machen). Ivo PS: Das alles soll offline funktionieren, ich will meine Daten nicht an Google verschicken, ich will das ganze eigentlich auch selber trainieren, auch weil ich Worte, bzw den Namen, bisher in noch keinem Duden gefunden habe, deshalb würde Google & Co diesen Namen nicht erkennen
Ich hab letztens gelesen dass Microsoft da eine library für bereit gestellt hat... Weiß aber nicht mehr wo... Abgesehen davon kannst du ja sprachbefehle selbst definieren welche offline erkannt werden... Da brauchst keine weitere library... Is schon integriert
TI hat da was fuer ihre 55er DSPs gestrickt. TIDUBJ5A.PDF Das ist wenigestens solide und keine Inselaffentechnik.
1. Sprach-Samples als Basis aufnehmen 2. Fourier Analyse Deiner Sprach-Samples 3. Permanenter Vergleich Aufnahme gegenüber FT Deiner Sprach-samples 4. Entscheiden, ob Aufnahme valide ist
Fester Wortschatz? Sprecherabhängig? da braucht es kein neuronales Netz. wichtigerer ist eine gute Merkmalextraktion. Stichwort Cepstrum (ist praktischer als FFT) und gute Vergleichroutine. Das hat schon in den 90 auf kleinen DSPs (20MHz) funktioniert
> Stichwort Cepstrum (ist praktischer als FFT)
Sind ja eigentlich auch nur 2 FFT hintereinander.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.