Hmm .. klingt mäßig gut:
1 | espeak-ng -vde "Gibt es gute, neue Sprachgeneratoren für Linux?" |
Kennt jemand was Besseres?
|
|
Forum: Offtopic Sprachgenerator?Hmm .. klingt mäßig gut:
Kennt jemand was Besseres? :
Bearbeitet durch User
Stefan P. schrieb: > Christoph M. schrieb: >> Kennt jemand was Besseres? > > https://www.thorsten-voice.de Ich habe die "Thorsten Voice" gerade mal mit meinem Lieblingstesttext ausprobiert. Diesen Text... Achtung Computerraum! Dieser Raum ist voll bis unter die Decke mit den tollsten elektrischen und vollelektronischen Anlagen. Staunen und Gucken darf jeder, aber rumwurschteln und Knöpfchen drücken auf den Computern dörfe nur mir. Die Experten. ...in Hochdeutsch eingegeben und auf hessische Wiedergabe drücken, die Stimme hört sich dann fast so an wie der Originaltext auf dem Bild. Man muss bei der Texteingabe evtl. ein bisschen nachhelfen (am Ende das "ich" durch "mir" ersetzen). Die zweite Möglichkeit ist, den gewünschten Text einfach beim Google Übersetzer eingeben und auf Lautsprecherwiedergabe drücken. Dann müsste man allerdings parallel noch ein Aufnahmegerät mitlaufen lassen. Zum Beispiel den kostenlosen No23-Recorder. Der wandelt den gesprochenen Text direkt in eine MP3-Datei um! Marcel V. schrieb: > Die zweite Möglichkeit ist, den gewünschten Text einfach beim Google > Übersetzer eingeben und auf Lautsprecherwiedergabe drücken. Puh, so mit Cloud und Google. Das will ein Linux Nerd nicht. Da muss alles lokal und open source sein. Irgendwie scheint es bessere Spamgeneratoren, auch fuer Schockanrufgeneratoren, als ernsthafte Sprachgeneratoren zu geben. Ich war von Qwen3-TTS (https://github.com/QwenLM/Qwen3-TTS) ziemlich beeindruckt, Demo gibt’s unter https://qwen-qwen3-tts.hf.space/ Kann man bei Bedarf auch lokal laufen lassen – Nachteil mag sein, dass es nicht direkt echtzeitfähig ist, aber wenn man das nicht unbedingt braucht, wird das durch die Qualität der Sprachsynthese mehr als aufgewogen, finde ich. :
Bearbeitet durch User
Jack V. schrieb: > Kann man bei Bedarf auch lokal laufen lassen – Nachteil mag sein, dass > es nicht direkt echtzeitfähig ist, aber wenn man das nicht unbedingt > braucht, wird das durch die Qualität der Sprachsynthese mehr als > aufgewogen, finde ich. Kokoro läuft wohl etwas schneller und liefert auch super Ergebnisse. https://huggingface.co/spaces/hexgrad/Kokoro-TTS TTS scheint auf dem neuen Arduino-VENTUNO-Q zu laufen. Insbesondere zusammen mit Whisper kann man dann wohl ziemlich interessante Frage/Antwort Systeme machen.
https://www.arduino.cc/product-ventuno-q Bin gespannt, wie gut das in der Praxis funktioniert. Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.
|
|