www.mikrocontroller.net

Forum: Digitale Signalverarbeitung / DSP Unterschied Spracherkennung und Sprechererkennung


Autor: audiouser (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Guten Tag,
kann mir jmd. den merkmalstechnischen Unterschied zwischen einer 
Sprecher und einer Spracherkennung erklären? Klar, dass bei einer 
Sprechererkennung nicht der Inhalt des gesprochenen, sondern die 
personenbezogenen Merkmale von Bedeutung sind und bei der 
Spracherkennung nicht der Erzeuger des Sprachsignals sondern der Inhalt 
ermittelt werden soll. Bei der Sprecher sowie bei der Sprachrkennung ist 
die Vorverarbeitung gleich. Die Merkmalsextraktion mittels 
beispielsweise den MFCC's wird auch bei beiden Varianten angewandt. 
Ebenfalls die Klassifikation, beispielsweise mit der Vektorquantisierung 
und dem Kmeans Algorihmus. Aber wo trennen sich die beiden Verfahren. 
Ich habe zuerst gedacht, dass man je nach Verfahren die unteren 
Cepstralkoeffizienten nimmt oder die oberen. Aber auch da werden bei 
beiden Verfahren jeweils die ersten 12 (evtl. 1. und 2. Ableitung noch) 
Koeffizienten genommen. Oder wird bezogen auf das Quelle Filter Modell 
bei dem Cepstrum jeweils die Filtereigenschaft subtrahiert oder die 
Quelleigenschaft? Vielleicht kann mir da jmd. Licht ins dunkeln bringen, 
dafür wäre ich sehr dankbar.
Lieben Gruß und Dank


audiouser

Autor: Jan (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Hallo,

der Unterschied zwischen Spracherkennung  und Sprecherkennung liegt in 
der Sichtweise. Vor der Entscheidung, was du einprog. liegt die Frage 
nach dem Ausgangssignal an.
Sprache hat bestimmte Werte und Erkennungsmuster. So liegt Sprache bei 
einer Srechfrequenz von 3-8 Hz. Danach kommen wir zu der Frage was du 
Anstellen willst. So ist entweder eine Spracherkennung möglich indem du 
nach dieser Frequenz mit einer Dynamik von 30 dB suchst. Anderer jedoch 
aufwändigerer Ansatz wäre die Überlegung vorher entsprechende 
Sprachmuster/Erkennungsmuster im Ram zu hinterlegen und es abgleichen zu 
lassen. Dafür muss man aber eine Entsprechende Geschwindigkeit 
vorraussetzen.

Es wäre für die versierten Forenanhänger wahrscheinlich sinnvoll, wenn 
du dein Anliegen genauer erklärst.

Genau dieses Thema steht aber für mich und meine Programmierer demnächst 
an.

Vielleicht kann man sich da ja absprechen

Hoffe ich habe dir etwas weiterhelfen können.

Jan

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.
Hinweis: der ursprüngliche Beitrag ist mehr als 6 Monate alt.
Bitte hier nur auf die ursprüngliche Frage antworten,
für neue Fragen einen neuen Beitrag erstellen.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.