mikrocontroller.net

Forum: Mikrocontroller und Digitale Elektronik Spracherkennung


Autor: mark (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Gibt es ausser dem Spracherkennungsmodul von Conrad (~50 euro) nichts 
anderes?? braucht auch nicht soviel können nur so ungefähr 10 wörter 
oder so?

Autor: Chriz Baze (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Sagen wir mal so:
Ich bin überzeugt man könnte das hinbekommen, indem man an einen Atmel 
über den AD-Wandler ein Mikro mit Vorverstärker dranhängt, dann noch 
externen Speicher zum Aufzeichnen der Sprache. Das komplizierteste wäre 
dann wohl die Software zu proggen, um eingehende Sprachsignale 
auszuwerten. Kenn mich zwar noch nicht allzugut aus - ich vermute 
einfach mal der Arbeitsaufwand ist es nicht wert ;)
Vielleicht gibt es ja noch weitere Single-Chip-Lösungen; kenne 
allerdings keine.

Autor: Sebastian Wille (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hi Mark,

Atmel hat eine Appnote über die Sprachaufzeichnung (und -wiedergabe) mit 
einem Atmel. So hat man schon mal die Sprache als Digitalaufzeichnung. 
Das kann man jetzt ja mit einer Referenz-Aufzeichnung (+ eine gewisse 
Toleranz) abgleichen.

Von Conrad gibt's noch einen kleinen Chip um 3,50 Euro, der hat eine so 
genannte "Sprachaktivierung". Soweit ich das aber verstanden habe, 
reagiert der nur auf lauteres Rufen, klatschen etc.

Grüße,

Sebastian

Autor: mark (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ich glaube dieser Sprachaktivierungschip ist ein Mikro das in die Basis 
eines Transistors geschaltet ist und man mittels Poti Vorwiderstand die 
Lautstärke einstellen kann, ein Freund von mir ist mal vor gut einem 
Jahr auf einen Chip gestossen der 8 Wörter aufzeichnen kann und dann 
ständig den Ether nach den Wörtern durchsucht, und die Idee mittels 
selbst aufgebauten µC Board scheitert glaub ich schon daran, dass so ein 
Atmel mit dem nötigen Speicher gar nicht zu Recht kommt, aber bin für 
jede Idee offen..

Autor: Freddy (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Also eine Spracherkennung selber zu zaubern halte ich für ziemlich
abwegig. Ich verfolge das Thema schon seit einigen Jahren. Und hierzu
sind tiefgreifende Kenntnisse von Phonetic, Spectralanylse,
Signaltheorie, Markovketten usw. von nöten die zumindest einen DSP
vorraussetzt. Und kann wegen der Ressourcenknappheit im
Microcontrollerbereich meiß nur mäßig befriedigen. Ich habe das
Spracherkennungsmodul von Conrad. Aber die angegebene Erkennungsrate
ist nur theoretisch. Praktisch werden etwa 50% der Befehle erkannt. Bei
höherer Toleranz werden auch wesendlich mehr Befehle falsch erkannt.
Für Spielereien aber dennunch ausreichend. Du solltest dir besser so
ein fertiges Modul besorgen, und für die 10 Befehle einfach Parallel
ansteuern. Ich bastelle schon seit geraumer Zeit an der seriellen
Kommunikation inklusive Treiber für Neuanlage Löschen und Neutraining
von Wörtern. Das Ding ist ja nicht einfach Trainiert und gut ist.
Ändert sich der Standpunkt des Microfons so ist der Sprachsatz besser
neu zu trainieren.

Autor: nme (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hi,

einfache Wörter, die sich nicht gleich anhören sollten per
MatchedFilter zu erkennen sein.
Bei einer Faltung vom Eingangssignal mit dem MF kommt bei Gleichheit
der Signale ein Dirac am Ausgang, was die Übereinstimmung signalisiert.
Je höher die Verwandschaft der Wörter, umso höher ist und schlanker ist
der Peak, ansonsten wird er breiter und flacher. Markovketten und
Viterbi und eine ordentliche Phonetic Datenbank werden erst bei
"aufwendigeren" Satzbauten notwendig. Damit meine ich zum Beispiel
Diktierprogramme, die den gesprochenen Text in Schrift umsetzen.
Mit einer AKF kommt man eventuell ebenfalls zum Ziel.

Grüße

Autor: Frank (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
bei Pollin gibts ein Modul das billiger ist als Das vom grossen C. Unter
13 Euronen sollten eigentlich OK sein.

bye

Frank

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.
Hinweis: der ursprüngliche Beitrag ist mehr als 6 Monate alt.
Bitte hier nur auf die ursprüngliche Frage antworten,
für neue Fragen einen neuen Beitrag erstellen.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.