Forum: PC Hard- und Software Spracherkennung aus einem Video


von Joachim S. (jstrand)


Lesenswert?

Hallo!

Wie es oft bei manchen selbstgedrehten Videos so ist die man bekommt, 
oder auch mal selber mit dem Handy aufnimmt, ist die Sprache oft 
ziemlich leise oder von Umgebungsgeräuschen überlagert. An der Küste ja 
gerne mal der Wind... Ich suche daher eine Art 
Videobearbeitungsprogramm, dass Sprache erkennt und etwas hervorheben 
kann.
Die große Suchmaschine gibt eine Menge Ergebnisse für Spracherkennung im 
Sinne von "Sprache - zu - Textumwandlung", aber mehr noch nicht...

Vielleicht hat jemand von euch einen Tipp!?

Vielen Dank!

von HildeK (Gast)


Lesenswert?

Nachträglich kannst du versuchen, die tiefen und die hohen Töne 
abzudämpfen, so dass etwa Telefonqualität (0.3 ... 3.4kHz) übrig bleibt. 
Die Bandgrenzen kannst du natürlich nach oben und unten weiter ausdehnen 
und dabei abwägen, was noch akzeptabel ist und was nicht mehr - in Bezug 
auf Klang und Störungen.
Wirklich trennen kannst du den Störpegel vom Nutzsignal nicht mehr.
Bei professionellen Produktionen wird nachvertont .... :-)

Besser ist es natürlich, in solcher Umgebung ein externes Richtmikrofon 
und einen Windschutz zu verwenden.

von Frank K. (fchk)


Lesenswert?

Joachim Strand schrieb:

> Wie es oft bei manchen selbstgedrehten Videos so ist die man bekommt,
> oder auch mal selber mit dem Handy aufnimmt, ist die Sprache oft
> ziemlich leise oder von Umgebungsgeräuschen überlagert. An der Küste ja
> gerne mal der Wind... Ich suche daher eine Art
> Videobearbeitungsprogramm, dass Sprache erkennt und etwas hervorheben
> kann.

Nimmst Du den Ton stereo auf? Dann richte ein Mikrofon (I) auf den 
Sprecher und eines (Q) weg vom Sprecher oder im 90°-Winkel (je nach 
Richtcharakteristik des Mikrofons). Dann kannst Du per 
Spektralsubtraktion im Frequenzbereich Q von I abziehen und hast im 
Wesentlichen nur noch noch das Nutzsignal.

Mit Ton ist es wie mit Bild: Was an Informationen durch falsche 
Aufnahmetechnik weg ist, ist unwiederbringlich verloren. Die 
Signalverarbeitung ist daher immer erst der zweite Schritt. Der erste 
Schritt hat immer eine optimale Aufnahmetechnik zu sein.

fchk

von oszi40 (Gast)


Lesenswert?

Frank K. schrieb:
> optimale Aufnahmetechnik
...ist der erste Schritt zum Erfolg.
Nebengeräusche erschweren die sinnvolle Spracherkennung wesentlich. 
Filtern hilft oft wenig. Ein gutes Mikro wäre nützlich, auch bei IBM 
ViaVoice.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.