Gibt es ausser dem Spracherkennungsmodul von Conrad (~50 euro) nichts anderes?? braucht auch nicht soviel können nur so ungefähr 10 wörter oder so?
Sagen wir mal so: Ich bin überzeugt man könnte das hinbekommen, indem man an einen Atmel über den AD-Wandler ein Mikro mit Vorverstärker dranhängt, dann noch externen Speicher zum Aufzeichnen der Sprache. Das komplizierteste wäre dann wohl die Software zu proggen, um eingehende Sprachsignale auszuwerten. Kenn mich zwar noch nicht allzugut aus - ich vermute einfach mal der Arbeitsaufwand ist es nicht wert ;) Vielleicht gibt es ja noch weitere Single-Chip-Lösungen; kenne allerdings keine.
Hi Mark, Atmel hat eine Appnote über die Sprachaufzeichnung (und -wiedergabe) mit einem Atmel. So hat man schon mal die Sprache als Digitalaufzeichnung. Das kann man jetzt ja mit einer Referenz-Aufzeichnung (+ eine gewisse Toleranz) abgleichen. Von Conrad gibt's noch einen kleinen Chip um 3,50 Euro, der hat eine so genannte "Sprachaktivierung". Soweit ich das aber verstanden habe, reagiert der nur auf lauteres Rufen, klatschen etc. Grüße, Sebastian
Ich glaube dieser Sprachaktivierungschip ist ein Mikro das in die Basis eines Transistors geschaltet ist und man mittels Poti Vorwiderstand die Lautstärke einstellen kann, ein Freund von mir ist mal vor gut einem Jahr auf einen Chip gestossen der 8 Wörter aufzeichnen kann und dann ständig den Ether nach den Wörtern durchsucht, und die Idee mittels selbst aufgebauten µC Board scheitert glaub ich schon daran, dass so ein Atmel mit dem nötigen Speicher gar nicht zu Recht kommt, aber bin für jede Idee offen..
Also eine Spracherkennung selber zu zaubern halte ich für ziemlich abwegig. Ich verfolge das Thema schon seit einigen Jahren. Und hierzu sind tiefgreifende Kenntnisse von Phonetic, Spectralanylse, Signaltheorie, Markovketten usw. von nöten die zumindest einen DSP vorraussetzt. Und kann wegen der Ressourcenknappheit im Microcontrollerbereich meiß nur mäßig befriedigen. Ich habe das Spracherkennungsmodul von Conrad. Aber die angegebene Erkennungsrate ist nur theoretisch. Praktisch werden etwa 50% der Befehle erkannt. Bei höherer Toleranz werden auch wesendlich mehr Befehle falsch erkannt. Für Spielereien aber dennunch ausreichend. Du solltest dir besser so ein fertiges Modul besorgen, und für die 10 Befehle einfach Parallel ansteuern. Ich bastelle schon seit geraumer Zeit an der seriellen Kommunikation inklusive Treiber für Neuanlage Löschen und Neutraining von Wörtern. Das Ding ist ja nicht einfach Trainiert und gut ist. Ändert sich der Standpunkt des Microfons so ist der Sprachsatz besser neu zu trainieren.
Hi, einfache Wörter, die sich nicht gleich anhören sollten per MatchedFilter zu erkennen sein. Bei einer Faltung vom Eingangssignal mit dem MF kommt bei Gleichheit der Signale ein Dirac am Ausgang, was die Übereinstimmung signalisiert. Je höher die Verwandschaft der Wörter, umso höher ist und schlanker ist der Peak, ansonsten wird er breiter und flacher. Markovketten und Viterbi und eine ordentliche Phonetic Datenbank werden erst bei "aufwendigeren" Satzbauten notwendig. Damit meine ich zum Beispiel Diktierprogramme, die den gesprochenen Text in Schrift umsetzen. Mit einer AKF kommt man eventuell ebenfalls zum Ziel. Grüße
bei Pollin gibts ein Modul das billiger ist als Das vom grossen C. Unter 13 Euronen sollten eigentlich OK sein. bye Frank
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.