Forum: Mikrocontroller und Digitale Elektronik Microphone array - Stimme direkt verstärken


von Robert (Gast)


Lesenswert?

Hi,

ich möchte einen Microphone-Array mit Rasperry PI benutzen um die 
lauteste Stimme zu extrahieren und direkt über einen Lautsprecher zu 
verstärken. Ist es machbar? Welches MicrophoneArray würdet ihr 
empfehlen?

von Lothar M. (Firma: Titel) (lkmiller) (Moderator) Benutzerseite


Lesenswert?

Nur damit wir vom selben reden: du meinst mit Mikrofonarray eine lokale 
Ansammlung von Mikrofonen (<<1m²), mit der aus einer Menge Stimmen in 
einem Raum eine einzelne herausgefischt und über Lautsprecher 
wiedergegeben werden soll?

Oder meinst du eine simple Vorrangschaltung, wo jeder in einer Gruppe 
ein Mikrofon vor sich hat und dort die lauteste Quelle ausgewählt und 
wiedergegeben werden soll?

von Patrick C. (pcrom)


Lesenswert?

Ich denke es musz mehr spezifiziert werden
* Was meinst du genau mit lauteste stimme ? Manche sprechen hoch, 
anderen sprechen tief.
* Wie lange musz dieses kanal aktiv bleiben ? Wann soll es resetten ?
* Was meinst du mit ein MicrophoneArray ?
* Was ist schon vorhanden ?

Estwas mehr hintergrund-geschichte/Anwendungs-beschreibung waehre gut

Patrick

von Amateur (Gast)


Lesenswert?

Das wird nicht ganz einfach! Vor allem, wenn man es doppelt nimmt.

Selbst der Vorlauteste muss mal Luft holen. Dann tönt aber die Nummer 
Zwei. Auch äußert sich die "Nummer Eins", in den seltensten Fällen, mit 
konstanter Lautstärke, weshalb sich auf diesem Wege schnell die 
Rangfolge ändert.

Schätze mal, dass eine Selektion auf diesem Weg direkt neben das Ziel 
führt.

Und noch was: In vielen Fällen ist der Lauteste nur der Nächste. In der 
Akustik gibt es einen netten Haufen sehr krummer Relationen.

Ein Bleistift: Deine Nummer Eins spricht zur Seite, Deine Nummer Zwei 
steht zwar weiter weg, quatscht aber in Richtung Mikro.

von Theor (Gast)


Lesenswert?

Es scheint mir bemerkenswert, dass alle bekannten praktischen Lösungen 
für den Fall mehrere Sprecher in einem großen Raum auf einzeln 
aktivierte Mikrophone hinauslaufen. Die Lösung für den Fall des TO hat 
also schonmal eine Grundtendenz dahin, wenn man das so sagen will. Mal 
abgesehen davon, dass ich die "Situation" wegen fehlender Beschreibung 
nur einigermaßen plausibel vermuten kann.

Es wird das Problem vermutlich nicht vereinfachen, aber es ist 
vielleicht doch sinnvoll, mal ganz klassisch, mit der Ausgangssituation 
zu beginnen.
D.h.
1. Was ist die Situation?
2. Was ist das Problem?
3. Wie wurde das bisher gelöst? (Falls zutreffend).

4. Wieso, also aufgrund welcher Überlegungen, sollen die genannten 
Elemente das Problem lösen?
Die Elemente sind: a) Mikrophon-Array b) lauteste Stimme c) direkt 
(Warum dieses Wort?)

von Theor (Gast)


Lesenswert?

Theor schrieb:
> Es scheint mir bemerkenswert, dass alle bekannten praktischen Lösungen
> für den Fall mehrere Sprecher in einem großen Raum auf einzeln
> aktivierte Mikrophone hinauslaufen.

Dieser Satz scheint mir, aus rein statistischen Gründen, bei erneutem 
Lesen dann doch zu allgemein um zutreffend sein zu können.

Ich will vielmehr sagen, dass meiner Beobachtung nach (und die Menge und 
Verteilung meiner Beobachtungen ist relativ begrenzt) alle mir 
bekannten tatsächlich angewendeten Lösungen, für den Fall [... wie oben] 
auf einzeln aktivierte Mikrophone hinauslaufen.

Es mag durchaus Ausnahmen geben oder sogar regelmäßige andere reale 
Situationen die mir nicht bekannt sind.

Diese Relativierung ändert aber nichts an meiner Meinung, dass eine 
Analyse sinnvoll ist.

von MaWin (Gast)


Lesenswert?

Robert schrieb:
> ich möchte einen Microphone-Array mit Rasperry PI benutzen um die
> lauteste Stimme zu extrahieren und direkt über einen Lautsprecher zu
> verstärken. Ist es machbar? Welches MicrophoneArray würdet ihr
> empfehlen?

Ja und nein.

Technisch ist das möglich, die Laufzeit zu berechnen und eine einzelne 
Quelle  im Raum mit Unterdrückung der Nachbarn wiederzugeben.

Wird für Telekonferenzsysteme gemacht, habe ich mir auf einer Messe mal 
angesehen, war glaube ich von Dynacord. Die nutzten 9 Mikrophone.

Aber mit einem rPi Kinderspielzeugrechner ? Wohl kaum, der ist nicht 
echtzeitfähig genug, da muss wohl schon ein DSP her.

von foobar (Gast)


Lesenswert?

[Ich geh mal davon aus, dass es darum geht, aus einem Array aus 
Mikrophonen per SW eine Art Richtmikro zu machen.]

> Welches MicrophoneArray würdet ihr empfehlen?

Keine Ahnung, was es da gibt, aber nicht vergessen, du mußt die Daten 
auch halbwegs synchron in den Rechner bekommen.


> Die nutzten 9 Mikrophone.
>
> Aber mit einem rPi Kinderspielzeugrechner ? Wohl kaum, der ist nicht
> echtzeitfähig genug, da muss wohl schon ein DSP her.

Och, da seh ich nicht so das Problem. 9 Audiotracks zu mischen schafft 
der in "Echtzeit" - allzu komplexe Algorithmen dürften da nicht 
anfallen.  Notfalls wird die Samplerate runtergesetzt.  Der Scan zur 
Neuausrichtung des Arrays (und Umkonfiguration des Mischers) kann 
gemächlich im Hintergrund ablaufen - man will ja nicht alle paar 
Millisekunden umschalten.  Für erste Versuche sollte ein rPi reichen ...

Beitrag #5961186 wurde von einem Moderator gelöscht.
von Robert (Gast)


Lesenswert?

Ok, ok. Ich gebe mehr Infos. Ein separates Mikrofon für alle kommt nicht 
in Frage. Ich habe eine Aufgabe bekommen in einem Raum 5x5x3m wo viele 
Anwesend sein, die Stimme der gerade sprechenden Person zu verstärken in 
dem das gesprochene über einen Lautsprecher zusätzlich verstärkt 
ausgegeben wird. Es geht auch nicht ein Mikrofon zu überreichen und die 
Lösung kann auch nicht viele Tausend Euro kosten. Wichtig ist echo 
cancelation und dass die Stimme der gerade sprechender Person verstärkt 
wird.

von Klaus R. (klara)


Lesenswert?

Robert schrieb:
> Ein separates Mikrofon für alle kommt nicht
> in Frage.

Warum nicht? Das wäre wesentlich einfacher und würde fuktionieren.

> Ich habe eine Aufgabe bekommen in einem Raum 5x5x3m wo viele
> Anwesend sein, die Stimme der gerade sprechenden Person zu verstärken in
> dem das gesprochene über einen Lautsprecher zusätzlich verstärkt
> ausgegeben wird.

Also der lauteste erhält das Wort.

> Es geht auch nicht ein Mikrofon zu überreichen und die
> Lösung kann auch nicht viele Tausend Euro kosten.

Sagt dies das Controlling? Aber funktionieren soll es doch?

> Wichtig ist echo
> cancelation und dass die Stimme der gerade sprechender Person verstärkt
> wird.

Dann sind wir wieder bei, jeder bekommt ein separates Mikrofon.
mfg Klaus

von Klaus R. (klara)


Lesenswert?

Robert schrieb:
> Welches MicrophoneArray würdet ihr
> empfehlen?

Ich hätte da etwas.
https://www.cae-systems.de/
mfg Klaus

von Karl B. (gustav)


Lesenswert?

Hi,
also, wenn ich mal kurz einwerfen darf,
bei meiner Soundkarte ist immer eine Latenz da bei Mikrofonaufnahmen, 
die ich direkt mit Kopfhörer abhöre.
Und der Rechner ist nicht gerade langsam.

Es müssen da schon spezielle Sachen verwendet werden.

MaWin schrieb:
> Aber mit einem rPi Kinderspielzeugrechner ? Wohl kaum, der ist nicht
> echtzeitfähig genug, da muss wohl schon ein DSP her.

ciao
gustav

von MaWin (Gast)


Lesenswert?

Robert schrieb:
> Ok, ok. Ich gebe mehr Infos.
> Ich habe eine Aufgabe bekommen in einem Raum 5x5x3m wo viele
> Anwesend sein, die Stimme der gerade sprechenden Person zu verstärken
> die
> Lösung kann auch nicht viele Tausend Euro kosten

Du sollst für lau ein Einzelstück entwickeln für das Firmen auch als 
Produkt viele Tausende verlangen und bekommen ?

Unwahrscheinlich, dass das was wird. Natürlich müssen Echos des Raumes 
erkannt werden und unterdrückt.

Welche Mikrophone ist egal, es tun billige Elektred. Die Rechenleistung 
macht es. Und Mikrosekunden Auflösung, also mehr als ein Sample alle 
44-tausendstel Sekunde.

von Andreas H. (ahz)


Lesenswert?

Robert schrieb:
> Ok, ok. Ich gebe mehr Infos.

Sehr grosszügig.

> Es geht auch nicht ein Mikrofon zu überreichen und die
> Lösung kann auch nicht viele Tausend Euro kosten.

Weiss das Opfer etwas davon?

Klingt irgendwie nach Studienarbeit^^

P.S:
Warum kaufst Du nicht sowas?
https://www.acoustic-camera.com/fileadmin/acoustic-camera/support/downloads/AC_brochure_2019-4_EN.pdf

: Bearbeitet durch User
von Klaus R. (klara)


Lesenswert?


von S. R. (svenska)


Lesenswert?

Robert schrieb:
> Ok, ok. Ich gebe mehr Infos.

Hmm. Das wirft das Projekt von "mal schauen, klingt schwierig" zu "das 
wird nix", insofern also schonmal nützlich.

> Ich habe eine Aufgabe bekommen

Von wem? In welchem Kontext? Wieviel Vorkenntnisse hast du in den 
Bereichen Akustik und Echtzeitdatenverarbeitung? Auf wieviel 
Unterstützung kannst du zurückgreifen?

Im Uni-Umfeld ist sowas machbar, wenn der Lehrstuhl kompetent ist und 
hinreichend Forschung auf dem Tisch liegt. Andernfalls: Vergiss es.

> Es geht auch nicht ein Mikrofon zu überreichen und die
> Lösung kann auch nicht viele Tausend Euro kosten.

Entweder, DU kostet viele Tausend Euro (die deine Firma hat), oder du 
bist ein kostenloser Student, den man mal so richtig schön gegen die 
Wand laufen lassen kann.

von Christian S. (roehrenvorheizer)


Lesenswert?

Hier im Video wird beispielhaft demonstriert, was dem TO in seinen 
kühnsten Träumen vorschwebt:

https://m.youtube.com/watch?v=xSYLtxpfaIY

Wobei im Video keine Störer auftreten.

Hier mit Störern:
https://m.youtube.com/watch?v=ztymP0vc6vE


Oder hier, beste Werbung durch begeisterte user:

https://m.youtube.com/watch?v=E49x0-pPQDU

MfG

: Bearbeitet durch User
von Theor (Gast)


Lesenswert?

Robert schrieb:
> Ok, ok. Ich gebe mehr Infos.

Im geschriebenen Text, sind die "Zwischentöne" nicht zu erkennen. Aber 
ich habe nach dem Lesen aufgrund der Wortwahl und Formulierung das 
Gefühl von einer Kombination von Überdruss und geduldigem Entgegenkommen 
Deinerseits. Ist es das, wass Du uns mitteilen wolltest?


> Ein separates Mikrofon für alle kommt nicht
> in Frage. [...]

Im Vorgriff auf den Gesamteindruck von diesem und Deinem ersten Beitrag, 
sehe ich mich veranlasst, eher noch mehr und ausführlichere 
Informationen zu wünschen. Sehr ausführliche.

Man muss sagen, dass sowas im Rahmen einer akademischen Aufgabe oder 
eines kommerziellen Auftrags - wenn man unbedingt auf einzelne Mikrofone 
verzichten will - und wenn es gut und zuerlässig funktionieren soll, zu 
den schwierigeren, - und ich meine Schwierig -, der Elektroakustik und 
Daten- bzw. Signalverarbeitung gehört. Wie schätzt Du das ein und auf 
welcher Basis beruht diese Deine Einschätzung?

Ich bitte Dich auch noch zu bedenken, dass wir hier voraussichtlich Zeit 
und Gedanken in eine Sache stecken, die zuerst mal Dir und nur Dir einen 
Vorteil bringt, falls Du nicht, durch Angabe von viel Information und 
dem Teilen der Details bei den noch auftretenden Problemen auch uns 
dabei etwas lernen lässt.

Zunächst also, halte ich eine bescheidene und vor der Aufgabe 
respektvolle Haltung für angebracht. Für die angemessene Haltung vor der 
Natur, der Physik, auch ganz gut, mal zu sehen, dass man nicht alles so 
einfach mal eben macht. :-)
Auch werden sich viele hier, so vermute ich, darüber freuen wenn Du 
höfliches Entgegenkommen zeigst.


Die ersten Fragen sind schon von verschiedener Seite gestellt worden. 
Bitte beantworte sie in dem beschriebenen Sinne; und zwar alle.

von Christian S. (roehrenvorheizer)


Lesenswert?

Hallo,

das Vorhaben stellt sicher kein Einsteigerprojekt dar, zumal die drei 
einleitenden Sätze das nötige Fachwissen vermissen lassen.

Immerhin gibt es dies bereits fertig zu kaufen und ist sicherlich in 
mehrfachen Testläufen optimiert worden, um marktfähig zu sein.

Z.B.
http://www.clearone.com/converge-pro-2-48vt-0

mfG

von Sebastian R. (sebastian_r569)


Lesenswert?

Ich habe mal einen Sprachassistenten für einen Kunden entwickelt, der 
dann in Hotelzimmern zum Einsatz kommen sollte und Öffnungszeiten der 
Sauna, Massagetermine, Raumsteuerung,... für die Gäste übernehmen 
sollte.
Über den Prototypen gings leider nie hinaus.

Herzstück des Gerätes war aber ein Controller von XMOS. Die sind genau 
auf die Anwendung in Sprachassistenten gezüchtet und es gibt 
entsprechende Libraries für das Beamforming, die 
Hintergrundgeräuschunterdrückung,... bereits mit dazu.

Mit 7 MEMS-Mikrofonen war das Ergebnis schon beeindruckend.

So als Einstieg:
https://www.xmos.com/products/voice/micarray

Oder etwas kleiner und mit 60€ deutlich günstiger:
http://wiki.seeedstudio.com/ReSpeaker_Mic_Array_v2.0/

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.