Forum: Mikrocontroller und Digitale Elektronik ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Ben B. (Firma: Funkenflug Industries) (stromkraft)

10.02.2026 07:44

Lesenswert?

•

Moin.

Ich habe mal eine Frage zur Geschwindigkeit eines ESP32:

Wenn man mehrere Audio-Streams in eine Datei auf einer SD-Karte packen 
möchte, was schafft der ESP32 an Daten zu lesen, zu splitten und dadurch 
einen dieser Streams über sein I2S Audio-Interface auszugeben?

Angenommen, man nimmt zwei Streams mit 48kHz 16bit Stereo, dann kommt 
einer davon auf 48.000 x 2bytes (16bit) x 2 Kanäle = 192kbyte/s. Mal 
zwei Streams sind das schon 384kbyte/s. Wenn man die Streams in Frames 
zu sagen wir 25ms aufteilt, sind das 4,8kbyte Audio-Daten pro Stream 
(zwei Streams 9,6kbyte), aber man muss pro Sekunde 40 dieser Frames an 
das I2S-Interface schicken.

Bevor ich das nun ausprobiere und am Ende enttäuscht feststelle, daß es 
nicht geht, frage ich lieber mal nach: Ist der ESP32 schnell genug, 
40mal pro Sekunde 9,6kbyte aus einer Datei von einer SD-Karte zu lesen, 
daraus 4,8kbyte Daten zu extrahieren und diese an das I2S-Interface zu 
schicken? Es wäre schön, wenn jemand da Erfahrungswerte aus der Praxis 
hat.

Alle Bibliotheken, die ich dazu auf die Schnelle gefunden habe, benutzen 
irgendwelche Subroutinen, die das Lesen der Daten von der SD-Karte und 
die Ausgabe auf dem I2C-Interface alles alleine machen. Das ist 
natürlich super simpel, bietet aber nicht die Möglichkeit, eigene 
Datenformate zu nutzen und schleust alle Daten wenn man das so sagen 
möchte, an der CPU vorbei.

Ich würde das gerne mit der Arduino-Plattform probieren, gibts da 
entsprechende Funktionen, um die DMA-Fähigkeit des I2C-Interfaces zu 
nutzen bzw. einen Audio-Puffer unterbrechungsfrei aufzufüllen, so daß es 
zu keinen Störgeräuschen beim Audio kommt?

Etwas ähnliches hatte ich vor langer Zeit schon mit dem 486er bzw. 
Pentium und einer Soundblaster-Karte probiert, einen eigenen WAV-Player 
zu basteln. Da waren die Frames am Ende glaube ich 64kbyte lang und die 
Soundkarte hat sich die Daten per DMA geholt, aber der Rechner war trotz 
Assembler nicht schnell genug, am Ende eines DMA-Transfers neue Daten in 
den Puffer zu schreiben und einen neuen DMA-Transfer zu starten. Das 
führte zu Störgeräuschen durch die kurze Pause und man musste den 
DMA-Transfer so konfigurieren, daß er automatisch wiederholt wird und 
dann immer eine Hälfte des Puffers updaten während die andere abgespielt 
wurde. Keine Ahnung, ob der ESP32 was ähnliches kann, so daß die Daten 
unterbrechungsfrei zum I2S-Interface kommen, obwohl sie in Stücken in 
den Puffer kopiert werden.

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Richie (mikro123)

10.02.2026 08:12

Lesenswert?

•

▲
▼

Grundsätzlich, also mit ESP-IDF, ist das gar kein Problem.
Mit Arduino kenne ich mich nicht aus, aber da muss man halt darauf 
achten, dass man keine der doch häufiger vorkommenden schlechten 
Bibliotheken benutzt.

Du hast aber nicht geschrieben, ob die Hardware bereits vorgegeben ist 
oder noch ausgewählt werden kannst. Da gibt es dann natürlich auch noch 
Stellschrauben:
- Ist der ursprüngliche ESP32 gemeint oder kann es auch ein ESP32-S3 
oder ESP32-P4 sein?
- Wird PSRAM als Puffer genutzt?
- Falls ja, mit welcher Taktfrequenz läuft der PSRAM (bei P4 bis zu 
200MHz)?
- Wie ist die SD-Karte angeschlossen (SPI, 1Bit, 4Bit)

Ich denke, selbst im ungünstigsten Fall sollte das reichen, aber wenn Du 
noch die Hardware auswählen kannst, dann musst Du Dir sowieso keine 
Gedanken machen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Harald K. (kirnbichler)

10.02.2026 08:56

Lesenswert?

•

▲
▼

Der potentielle Flaschenhals dürfte die SD-Karte sein. Zwar versprechen 
deren Hersteller Wunderdinge in Sachen Geschwindigkeit, die harte 
Realität sieht aber meist sehr anders aus - und hier kommt die Anbindung 
der SD-Karte nochmal ganz deutlich zum Tragen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Ben B. (Firma: Funkenflug Industries) (stromkraft)

10.02.2026 10:54

Lesenswert?

•

▲
▼

Bei der Auswahl der Hardware bin ich absolut flexibel, das Projekt wenn 
man es überhaupt schon so nennen will, ist noch im Ideen-Stadium. Ich 
hatte nur den ESP32 im Auge, weil ich damit (und mit der 
Arduino-Plattform) ein gutes Benutzer-Interface hinkriege (WLAN).

Also es darf ruhig eine leistungsstarke ESP32-Variante sein, da nehme 
ich gerne Vorschläge an, sollte aber von der Arduino-Plattform 
unterstützt werden. So wie ich das mitbekommen habe, gibts da bei neuen 
Modellen gerne mal Probleme.

> - Ist der ursprüngliche ESP32 gemeint oder kann es auch
> ein ESP32-S3 oder ESP32-P4 sein?
Wenn der -S3 oder -P4 von der Arduino-Plattform unterstützt wird und man 
das Modul vielleicht sogar bastelfreundlich wie die ursprünglichen ESP32 
(-WROOM) bekommt, dann darf es auch gerne ein -S3 oder -P4 sein. Ich 
werde mal schauen, was diese beiden Varianten besser können als der 
ursprüngliche ESP32.

Edit: Gerade gelesen, der -P4 hat kein WiFi mehr,
damit ist der eigentlich raus.

> - Wird PSRAM als Puffer genutzt?
Meinst Du nicht, daß das interne RAM des ESP32 ausreicht wenn man mit 
25ms langen Audio-Frames arbeitet? Oder ist das zu langsam?

> - Falls ja, mit welcher Taktfrequenz läuft der PSRAM
> (bei P4 bis zu 200MHz)?
Wenn nötig, dann nehme ich 200Mhz - aber müsste dann irgendwie bereits 
im ESP32-Modul verbaut sein, weil 200Mhz krieg ich mit einer 
Bastelplatine bestimmt nicht so locker zusammen.

> - Wie ist die SD-Karte angeschlossen (SPI, 1Bit, 4Bit)
Gerne 4 Bit, wenn das das WLAN-Modul, das I2S-Interface und ein 
SPI/UART-Interface nicht behindert.

10.02.2026 11:02: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Richie (mikro123)

10.02.2026 19:16

Lesenswert?

•

▲
▼

Ich hab das mal schnell mit dem Arduino-Zeugs für Dich ausprobiert:

Als Richtwert für eine untere Grenze habe ich ein altes ESP32 Modul 
genommen und die SD-Karte mit SPI angesteuert.
Die SD-Karte ist eine SanDisk 32GB SDHC(UHS-I 10). Formatiert war sie 
mit FAT32.

Damit komme ich auf 432kB/s.
Das liegt schon über den von Dir geforderten 375kB/s.
Mit dem SDIO 4Bit Modus kommst Du dann auf ein Vielfaches.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von René H. (mumpel)

10.02.2026 19:49

Lesenswert?

•

▲
▼

Was möchtest Du erreichen? Wieviel Musik möchtest Du speichern?

10.02.2026 19:53: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: ESP32 WAV-Player: Praxiswert der CPU-Geschwindigkeit gesucht

von Ben B. (Firma: Funkenflug Industries) (stromkraft)

10.02.2026 21:17

Lesenswert?

•

▲
▼

@Richie
Danke Dir für Deine Mühe, das stimmt doch schon mal zuversichtlich.

Also die grundlegende Idee ist, in einer WAV-ähnlichen Datei sowas wie 
Subchannel-Daten abzulegen, die dann synchron mit einem Audio-Inhalt zur 
Verfügung stehen, oder eben auch zwei (oder mehrere) Audio-Streams.

So eine Datei zu basteln ist eigentlich trivial, vor allem wenn man eine 
konstante Frame-Länge benutzt. Damit kann man diese Datei aber nicht 
mehr einfach so an Standard-Bibliotheken übergeben und dem ESP32 einfach 
sagen "Spiel mal diese Datei von der SD-Karte ab", sondern man muss die 
Daten einlesen, die Datenströme splitten und dann den Audio-Inhalt so 
über das I2S-Interface ausgeben, daß dabei der Audio-Puffer nicht 
leerläuft und es keine Störgeräusche gibt.

Im Moment denke ich am meisten über den Standard-ESP32 nach, also die 
ursprüngliche Variante. Da bekäme man zwei 240Mhz-Cores, man könnte den 
zeitkritischen Programmteil (der die Daten in Echtzeit lesen, 
verarbeiten und das I2S füttern muss) auf einem Core laufen lassen und 
das WLAN-User-Interface-Gedöns auf dem anderen Core.

Leider weiß ich im Moment noch nicht viel über das I2S-Interfache, also 
was es kann... wie lang der Audio-Puffer sein kann und ob man den 
aktuellen Füllstand des Audio-Puffers irgendwo her ermitteln kann.

Eine Alternative wäre evtl. - falls man zwei Dateien von der SD-Karte 
gleichzeitig lesen kann - die Streams in verschiedenen Dateien 
abzulegen. Wenn die Standard-Audio-Bibliotheken in schneller Folge und 
ausreichend hoher Auflösung die aktuelle Spielzeit übermitteln können, 
dann könnte man die Subchannel-Daten aus einer anderen Datei lesen und 
über die Spielzeit synchronisieren. Nachteil: mehrere Dateien, Vorteil: 
man braucht sich praktisch nicht um den zeitkritischen Audio-Kram zu 
kümmern.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net