Forum: Mikrocontroller und Digitale Elektronik Spracherkennungs-chip low-power


von Mario (Gast)


Lesenswert?

Ich suche eine Lösung, um die heimische Raumbeleuchtung sprachgesteuert 
zu bedienen.

Es sollten ca 10-20 Befehle anzulernen sein, für mindestens 4 Sprecher, 
noch besser wäre sprecherunabhängig, z.b.
Hugo, Licht an/aus!
Hugo, Licht heller!
Hugo, Licht 20/40/60/80/100 Prozent!
...

Es soll stromsparend (<2W), offline (kein Alexa, Siri) und mit etwas 
Hintergrundgeräuschen (Gespräche, Musik in Zimmerlautstärke) 
funktionieren.

Gibt es dafür Chips/Module? Auch FPGAs sind angeblich für sowas 
geeignet, aber gibt's geeignete devboards unter 100 Euro, oder geht das 
in Richtung 1000 Euro?

Ich würde mich über eure Einschätzung freuen, aber bitte nur wenn ihr 
Ahnung vom Thema habt, nicht das übliche Volltrottelgeschwafel der 
üblichen Verdächtigen. Danke!

von Samuel C. (neoexacun)


Lesenswert?

Unter 2W könnte schwer werden. Mit einem Raspi wäre etwas machbar.
https://schmidt-feldberg.de/sprachsteuerung-auf-dem-raspberry-pi-mit-jarvis/

von Markus E. (engelmarkus)


Lesenswert?

Mit einem Raspberry Pi hab ich das hier mal benutzt, das funktioniert 
gut:
https://snips.ai/

Aber da wirst du noch einige Lösungen finden, wenn du etwas suchst. Was 
noch kleineres bzw. stromsparenderes... keine Ahnung.

von S. R. (svenska)


Lesenswert?

Im Nachbarthread wurde der RISC-V Maixduino 
(https://maixduino.sipeed.com/en/) genannt, der für Mustererkennung bzw. 
Machine Learning gedacht ist, aber keinen Audioeingang hat. In die 
gleiche Richtung gehen auch andere Boards, wie z.B. Spresense 
(https://developer.sony.com/develop/spresense/).

Das sind aber nur stromsparende Inferenzmaschinen. Modelle für 
Spracherkennung sind da nicht drin, die brauchst du noch selbst.

von Mario (Gast)


Lesenswert?

S. R. schrieb:
> Im Nachbarthread wurde der RISC-V Maixduino
> (https://maixduino.sipeed.com/en/) genannt, der für Mustererkennung bzw.
> Machine Learning gedacht ist

Ich kann dieses ML-Geschwafel nicht mehr hören. Spracherkennung ist ein 
bisschen mehr als Mustererkennung. Audioeingang ist kein Problem, aber 
berechnet der RISC-V auch stromsparend ein Mel/cepstrum?

von Guido L. (guidol1970)


Lesenswert?

als Spracherkennngssystem gibt es in der Preisklasse auch MOVI:
https://www.audeme.com/

Das sollte auch mit verschiedenen Sprechern klappen..

von Chris (Gast)


Lesenswert?

Ich habe noch ein Bausatz com grossen C.
Grosse mehr als rpi, definitiv Stromsparenden.

von S. R. (svenska)


Lesenswert?

Mario schrieb:
> Spracherkennung ist ein bisschen mehr als Mustererkennung.
> Audioeingang ist kein Problem, aber berechnet der RISC-V
> auch stromsparend ein Mel/cepstrum?

Spracherkennung ist stinknormale Mustererkennung auf eindimensionalen 
Zeitsignalen - mehr nicht. Die klassischen Algorithmen wurden von den 
"ML-Schwaflern" komplett überholt, dummerweise erst zwei Jahre, nachdem 
ich die gelernt habe.

Aber wenn du auf die klassischen Verfahren stehst: Beide Systeme sind 
stromsparend, ziemlich leistungsfähig und kommen mit FPU. Ob dir das 
reicht, ist mir egal.

von Dieter R. (drei)


Lesenswert?

https://www.cambridgeconsultants.com/press-releases/unveiling-worlds-lowest-power-voice-detection

11 Mikrowatt. Ob es inzwischen ein Produkt damit gibt, habe ich aber 
nicht herausbekommen können.

Ein Jahr davor wurde schon etwas ähnliches angekündigt:

https://www.electronicproducts.com/Internet_of_Things/Research/Low_power_chip_could_make_speech_recognition_ubiquitous_in_electronics.aspx

Beitrag #5979363 wurde von einem Moderator gelöscht.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.