Hallo liebe Mikrocontroller- User, Ich brauche für ein privates Projekt eine Sprachmodul das zum Beispiel per Code Wörter ausgibt. Es sollte also praktisch das Alphabet können. Das ganze würde ich am liebsten mit der CMOS- Technik bauen und mit einem Mikrocontroller ansteuern.Ich würde mich sehr über eure Hilfe freuen. IdeCMOS
Da haste mit dem Alphabet aber nicht viel Freude, das wird ja immer etwas anders ausgesprochen im Wort. Die automatischen Stimmen bestehen schon aus mehreren Wörtern. Also Hundert und Zehn ergibt Hundertzehn. Oder Hundert_und_fünf_zehn. Diese Wörter kommen dann zB als Wav datei auf eine SD karte oder Alks Array in Flash und werden so abgespielt, dass was sinnvolles bei rauskommt. Sag lieber was du als Ganzes vorhast und nicht nur den kleinen Teil hier mit man besser helfen kann.
Ich will eine Konsole bauen die eben ein System aus Mikrocontrollern hat. Dafür brauche ich halt ein Sprachmodul
Nimm einen dsPIC33FJ128GP802. Der hat Stereo Audio mit DMA-Fähigkeit eingebaut. Die Audiosamples speicherst Du auf einem SPI-Flash, z.B. ST M25P80 (1 MByte, es gibt aus der Baureihe bei Bedarf auch noch größere). Der dsPIC hat differentielle Analogausgänge, hinter die Du OpAmps (zB MCP6024) schalten musst. Das steht aber alles im Datenblatt und den AppNotes drin. So kannst Du Deine Wörter und Phoneme in ziemlich guter Qualität abspielen. fchk
es gibt fertige sprechmodule im www, wenn es nicht gefordert ist würde ich mich erstmal mit sowas an die materie herantasten...
Hier: Beitrag "Sprach IC Text to Speech (TTS)" und hier: http://www.avrfreaks.net/index.php?name=PNphpBB2&file=viewtopic&t=89761 und was Google sonst noch zu Text to Speech und Mikrocontroller ausspuckt.
Hallo die ISD15xxx-Reihe von Nuvoton (früher Winbond) kann Sprachansagen in verschiedenen Längen und Qualitäten/Formaten Also der ISD15108 ist der Chip mit der kleinsten Aufnahmedauer, ev. steht die 8 für 8min oder 8 MB, das hab ich vergessen. Sind im TQFP, glaub die alten Serien im DIP sind alle abgekündigt. Stichworte Chipcorder und voice ic Gruß Andi
Hier ist so ein fertiges Sprachmodul, das man per UART ansteuern kann: https://www.sparkfun.com/products/11711 (allerdings nur Englisch und Spanisch) Oder wie wäre es mit einem Embedded Linux Modul und eSpeak. eSpeak ist ein Open-Source-Sprach-Synthesizer, der Ausgaben in vielen Sprachen erzeugen kann. Z.B. über den Befehl "espeak -vde "zu sprechender Text". Allerdings klingt das etwas mechanisch. Dann gibt es auch noch Festival "echo "This is a test." | festival --tts", die Sprachausgabe klingt besser, allerdings ist es komplizierter da die Deutsche Sprache zu installieren. http://wiki.ubuntuusers.de/Sprachausgabe http://wiki.ubuntuusers.de/Festival/Kompilieren HOWTO: Make festival TTS use better voices (MBROLA CMU HTS): http://ubuntuforums.org/showthread.php?t=751169
Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber so ein modul bauen. Ich dachte man könnte per verschiedene ton höhen die einzelnen laute verwirklichen und wenn das ginge, dann würde ich das gerne nehmen. Außerdem würde ich lieber mir die eigenen libs schreiben. klar außer der Grafikkarte für das ich schon eine im auge haben.
Manuel O. schrieb: > Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber > so ein modul bauen. Ich dachte man könnte per verschiedene ton höhen die > einzelnen laute verwirklichen Wenn das so ginge würden das alle Navi Hersteller so machen statt ganze Worte oder zumindest Silben abzuspeichern. Und selbst dann klingt es oft holprig genug. Wenn du meinst besser als die alle zu sein und das gut hinkriegst lass es dir patentieren und werde reich :-)
Manuel O. schrieb: > Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber > so ein modul bauen. Aha, also ein längeres Projekt. :-) > Ich dachte man könnte per verschiedene ton höhen die > einzelnen laute verwirklichen und wenn das ginge, dann würde ich das > gerne nehmen. Ich denke, Du wirst nicht drumherum kommen, einzelne Silben zu speichern, und diese dann zu Wörtern zu kombinieren. Einfache Buchstaben zu kombinieren, wird nicht klappen, es sei denn, Du liebst buchstabierte Sprache. Ge-er-uh-eszet Ha-er-ah-el-de
:
Bearbeitet durch User
Dann einfach mal deinem Navi zuhöhren und das so machen wie ich das oben beschrieben habe und beherzige mein Post weiter oben. Nur mit Lauten ist dann doch schon etwas schwieriger. Da ließ mal den Wikipediartikel zu "Vocaloid": http://de.wikipedia.org/wiki/Vocaloid
Jo, kannste dir auch schonmal nen gutes Mikrophon kaufen zum Aufnahmen der einzelnen Wörter und Sprachfetzen. Das Teil soll wirklich universell sein? Oder reicht eine Ausgabe von gewissen Messwerten aus? Dann isses um einiges einfacher.
Ok,also jetzt mal, tschuldigung das ich die warscheinlich wichtigsten sachen nocht gesagt habe. Ich möchte keine Aufnahmen nehmen sondern per code ausgeben. Das Modul sollte wenn es braucht auch cmos technik haben( und ich denke nicht das cmos = mikrocontroller ist). Ich dachte eben das man mit einem Oszilator und einem teiler das verwirklichen kann. in dem Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240 MHz und einem teiler der bis zu 16 mal teilt vorgestellt und ich dachte das man das ganze so machen kann
Also gewisse Wortfetzen müssen schon vorhanden sein, totalsynthetisch ist richtig schwer. Selbst bei Vocaloid mussten vorher Sänger ihre Stimme leihen.
Manuel O. schrieb: > Ok,also jetzt mal, tschuldigung das ich die warscheinlich wichtigsten > sachen nocht gesagt habe. Ich möchte keine Aufnahmen nehmen sondern per > code ausgeben. Das Modul sollte wenn es braucht auch cmos technik haben( > und ich denke nicht das cmos = mikrocontroller ist). Ich dachte eben das > man mit einem Oszilator und einem teiler das verwirklichen kann. in dem > Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240 > MHz und einem teiler der bis zu 16 mal teilt vorgestellt und ich dachte > das man das ganze so machen kann Da denkst Du falsch. So funktioniert Sprache nicht. Was es gibt, ist das sogenannte Röhrenmodell, das die menschliche Stimmerzeugung nachbildet. Am Anfang steht ein Tongenerator (=Sfimmlippen), anschiend folgen verschiedene Röhren mit definierter Länge und Durchmesser (=Rachen, Mund,...). Das kann man mathematisch modellieren. Nutzt man im Mobilfunk für die Sprachdatenkompression. Für Dich ist das aber nicht praktikabel. Mein Vorschlag mit dem Audio-dsPic ist der Weg, mit dem Du mit dem geringsten Hardwareaufwand die beste Qualität hinbekommst. fchk
Manuel O. schrieb: > in dem > Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240 > MHz und einem teiler der bis zu 16 mal teilt vorgestellt Früher war mal Phonem Synthese angesagt. Der SC-01-A von Votrax ist ein typischer Vertreter dieser Technik. Google findet das Datenblatt. Damals war Speicher knapp und MP3 noch nicht erfunden. Im Prinzip ist es "jeder Buchstabe ein Code". Aber damit es vernünftig klingt, muss man doch viel Arbeit reinstecken. Die Sprache ist dann ganz gut verständlich, klingt aber sehr nach Computer.
oha..sowas hatte ich damals auf meinem Schneider CPC6128 mal in Basic abgetippt..war nicht so einfach zu verstehen, wird aber sowas sein, was Du wohl gerne haben willst. Da gibt es sicher doch besser Versionen auf heutigen µc.. Aber wo man da am besten nach Quellcode sucht..puhh.frag doch mal im Roboternetz, das klingt mir erstmal am naheliegensten
achne, sehen gerade das ist falsch, die haben da was spzezielles..es gab da jedenfalls auch nen Programm zwei A4 Seiten lang oder so.. Gibts sicher auch in C :-)
oh, in dem Lied von U96 das Boot war glaube ich der C64 bei der Sprachausgabe beteiligt http://www.youtube.com/watch?v=Jx2FDZIvg_0 Sowas meinst Du doch?
Ja, Tom, Danke. Nur so aus interese. gibt es einen chip der sowas möglich macht
wie machen den das spielekonsolen. wie erzeugen die die sprache
wie gesagt, ich würde mal im Roboternet.de fragen, da sitzen die praktiker, da bekommst Du brauchbare Antworten, hier wird mehr warme Luft produziert als Hilfe geleistet Vielelicht hat da einer einen Link zu einem fertigen code..wie gesgt, das Basicprogram war gar nicht mal soo lang...und sie Chips auf der Seite sind ja auch nur pics eben mit solch einem code drauf..mit etwas rumprobieren bekommst Du das sicher auch selber raus..aber bis man erstmal alle laute durhgeprobt hat, das währe mir zu blöd, hat ja alles chonmal wer gemacht darum sollte man nicht die zeit damit verschwenden immer wieder das Rad neu zu erfinden, ws hier viele aber ständig erwarten und daher nicht auf die Kette bekommen
kann bitte jemand diesen beitrag schliesen. Ich weiß nähmlich nicht wie das geht
Ich habe gerade im Wiki gelesen in welcher Frequenz die menschliche Stimme liegt. Mit ein bisschen Rechnen kann ich bestimmt einen Synthesizer bauen. PS.: Ich habe im Betreff Gelöst geschrieben, dass man nichts mehr reinschreibt. Kann bitte wenn möglich jemand anderes das Thema schließen oder schreiben wie das geht. Ich würde mich darüber sehr freuen.
Manuel O. schrieb: > Ich habe gerade im Wiki gelesen in welcher Frequenz die menschliche > Stimme liegt. Mit ein bisschen Rechnen kann ich bestimmt einen > Synthesizer bauen. Gewiss. Und den Prozess bis dahin nennt man "Lernen". > PS.: Ich habe im Betreff Gelöst geschrieben, dass man nichts mehr > reinschreibt. Kann bitte wenn möglich jemand anderes das Thema schließen > oder schreiben wie das geht. Ich würde mich darüber sehr freuen. Hier werden Threads nicht geschlossen. Du kannst auch einen 5 Jahre alten Thread nochmal ausgraben...
:
Bearbeitet durch Moderator
Lothar Miller schrieb: > Hier werden Threads nicht geschlossen. Du kannst auch einen 5 Jahre > alten Thread nochmal ausgraben... ...was leider in diesem Forum viel zu gern gemacht wird... Gruss Harald
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.