Ich suche eine Lösung, um die heimische Raumbeleuchtung sprachgesteuert zu bedienen. Es sollten ca 10-20 Befehle anzulernen sein, für mindestens 4 Sprecher, noch besser wäre sprecherunabhängig, z.b. Hugo, Licht an/aus! Hugo, Licht heller! Hugo, Licht 20/40/60/80/100 Prozent! ... Es soll stromsparend (<2W), offline (kein Alexa, Siri) und mit etwas Hintergrundgeräuschen (Gespräche, Musik in Zimmerlautstärke) funktionieren. Gibt es dafür Chips/Module? Auch FPGAs sind angeblich für sowas geeignet, aber gibt's geeignete devboards unter 100 Euro, oder geht das in Richtung 1000 Euro? Ich würde mich über eure Einschätzung freuen, aber bitte nur wenn ihr Ahnung vom Thema habt, nicht das übliche Volltrottelgeschwafel der üblichen Verdächtigen. Danke!
Unter 2W könnte schwer werden. Mit einem Raspi wäre etwas machbar. https://schmidt-feldberg.de/sprachsteuerung-auf-dem-raspberry-pi-mit-jarvis/
Mit einem Raspberry Pi hab ich das hier mal benutzt, das funktioniert gut: https://snips.ai/ Aber da wirst du noch einige Lösungen finden, wenn du etwas suchst. Was noch kleineres bzw. stromsparenderes... keine Ahnung.
Im Nachbarthread wurde der RISC-V Maixduino (https://maixduino.sipeed.com/en/) genannt, der für Mustererkennung bzw. Machine Learning gedacht ist, aber keinen Audioeingang hat. In die gleiche Richtung gehen auch andere Boards, wie z.B. Spresense (https://developer.sony.com/develop/spresense/). Das sind aber nur stromsparende Inferenzmaschinen. Modelle für Spracherkennung sind da nicht drin, die brauchst du noch selbst.
S. R. schrieb: > Im Nachbarthread wurde der RISC-V Maixduino > (https://maixduino.sipeed.com/en/) genannt, der für Mustererkennung bzw. > Machine Learning gedacht ist Ich kann dieses ML-Geschwafel nicht mehr hören. Spracherkennung ist ein bisschen mehr als Mustererkennung. Audioeingang ist kein Problem, aber berechnet der RISC-V auch stromsparend ein Mel/cepstrum?
als Spracherkennngssystem gibt es in der Preisklasse auch MOVI: https://www.audeme.com/ Das sollte auch mit verschiedenen Sprechern klappen..
Ich habe noch ein Bausatz com grossen C. Grosse mehr als rpi, definitiv Stromsparenden.
Mario schrieb: > Spracherkennung ist ein bisschen mehr als Mustererkennung. > Audioeingang ist kein Problem, aber berechnet der RISC-V > auch stromsparend ein Mel/cepstrum? Spracherkennung ist stinknormale Mustererkennung auf eindimensionalen Zeitsignalen - mehr nicht. Die klassischen Algorithmen wurden von den "ML-Schwaflern" komplett überholt, dummerweise erst zwei Jahre, nachdem ich die gelernt habe. Aber wenn du auf die klassischen Verfahren stehst: Beide Systeme sind stromsparend, ziemlich leistungsfähig und kommen mit FPU. Ob dir das reicht, ist mir egal.
https://www.cambridgeconsultants.com/press-releases/unveiling-worlds-lowest-power-voice-detection 11 Mikrowatt. Ob es inzwischen ein Produkt damit gibt, habe ich aber nicht herausbekommen können. Ein Jahr davor wurde schon etwas ähnliches angekündigt: https://www.electronicproducts.com/Internet_of_Things/Research/Low_power_chip_could_make_speech_recognition_ubiquitous_in_electronics.aspx
Beitrag #5979363 wurde von einem Moderator gelöscht.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.