Ich habe eine Audiodatei eines Sprechers mit librosa eingelesen. Ich will nun diese Audiodatei automatisch von Atemgeräuschen befreien. Als ersten Schritt möchte ich die Audiodateien nach angehängtem Bild segmentieren. Immer dann, wenn die annähernd gezeichnete rote Linie die Nullinie schneidet, soll eine Schnittmarke existieren. Welche Methode ist hier robust?
:
Bearbeitet durch User
Google mal nach voice activity detection python Gibt ein paar github Projekte dafür VG Roland