Forum: Mikrocontroller und Digitale Elektronik Spracherkennung mit neuronalem Netzwerk und Rasperry


Announcement: there is an English version of this forum on EmbDev.net. Posts you create there will be displayed on Mikrocontroller.net and EmbDev.net.
von Ivo -. (Gast)


Bewertung
0 lesenswert
nicht lesenswert
Hallo,
erstmal hoffe ich, dass ich hier im richtigen Unterforum bin, aber zum 
Thema:
Ich beschäftige mich gerade mit neuronalen Netzen und da frage ich mich, 
ob und wie gut eine Spracherkennung mit dem Pi umzusetzen ist, es geht 
nur um wenige Wörter (ca. 20).
Ich will damit, auch wenn es hier jetzt erstmal nicht relevant ist, eine 
"Alexiri nano" umsetzen, so will ich meine Projekte steuern können, 
bspw.sage ich: "Alexiri, Uhr", dann soll sie mir die Uhrzeit ansagen 
(das vorlesen würde ich dann mit espeak machen).

Ivo

PS: Das alles soll offline funktionieren, ich will meine Daten nicht an 
Google verschicken, ich will das ganze eigentlich auch selber 
trainieren, auch weil ich Worte, bzw den Namen, bisher in noch keinem 
Duden gefunden habe, deshalb würde Google & Co diesen Namen nicht 
erkennen

von Wolfgang H. (drahtverhau)


Bewertung
0 lesenswert
nicht lesenswert
Ich hab letztens gelesen dass Microsoft da eine library für bereit 
gestellt hat... Weiß aber nicht mehr wo... Abgesehen davon kannst du ja 
sprachbefehle selbst definieren welche offline erkannt werden... Da 
brauchst keine weitere library... Is schon integriert

von Texasschlumpf (Gast)


Bewertung
-1 lesenswert
nicht lesenswert
TI hat da was fuer ihre 55er DSPs gestrickt.

TIDUBJ5A.PDF


Das ist wenigestens solide und keine Inselaffentechnik.

von Stefan (Gast)


Bewertung
0 lesenswert
nicht lesenswert
1. Sprach-Samples als Basis aufnehmen
2. Fourier Analyse Deiner Sprach-Samples
3. Permanenter Vergleich Aufnahme gegenüber FT Deiner Sprach-samples
4. Entscheiden, ob Aufnahme valide ist

von Jim M. (turboj)


Bewertung
0 lesenswert
nicht lesenswert
Das https://jasperproject.github.io/ hattest Du gesehen?

von Volle22 (Gast)


Bewertung
0 lesenswert
nicht lesenswert
Fester Wortschatz?
Sprecherabhängig?

da braucht es kein neuronales Netz.

wichtigerer ist eine gute Merkmalextraktion.
Stichwort Cepstrum   (ist praktischer als FFT)
und gute Vergleichroutine.

Das hat schon in den 90 auf kleinen DSPs (20MHz) funktioniert

von Schalubischlumpf (Gast)


Bewertung
0 lesenswert
nicht lesenswert
> Stichwort Cepstrum   (ist praktischer als FFT)

Sind ja eigentlich auch nur 2 FFT hintereinander.

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.
Hinweis: der ursprüngliche Beitrag ist mehr als 6 Monate alt.
Bitte hier nur auf die ursprüngliche Frage antworten,
für neue Fragen einen neuen Beitrag erstellen.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.