Forum: Mikrocontroller und Digitale Elektronik Spachmodul, dass das Alphabet kann


von Manuel O. (idecmos)


Lesenswert?

Hallo liebe Mikrocontroller- User,
Ich brauche für ein privates Projekt eine Sprachmodul das zum Beispiel 
per Code Wörter ausgibt. Es sollte also praktisch das Alphabet können. 
Das ganze würde ich am liebsten mit der CMOS- Technik bauen und mit 
einem Mikrocontroller ansteuern.Ich würde mich sehr über eure Hilfe 
freuen.
IdeCMOS

von H.Joachim S. (crazyhorse)


Lesenswert?

Mikrocontroller sind heute meist CMOS :-)

von Mw E. (Firma: fritzler-avr.de) (fritzler)


Lesenswert?

Da haste mit dem Alphabet aber nicht viel Freude, das wird ja immer 
etwas anders ausgesprochen im Wort.

Die automatischen Stimmen bestehen schon aus mehreren Wörtern.
Also Hundert und Zehn ergibt Hundertzehn.
Oder Hundert_und_fünf_zehn.
Diese Wörter kommen dann zB als Wav datei auf eine SD karte oder Alks 
Array in Flash und werden so abgespielt, dass was sinnvolles bei 
rauskommt.

Sag lieber was du als Ganzes vorhast und nicht nur den kleinen Teil hier 
mit man besser helfen kann.

von Manuel O. (idecmos)


Lesenswert?

Ich will eine Konsole bauen die eben ein System aus Mikrocontrollern 
hat. Dafür brauche ich halt ein Sprachmodul

von Frank K. (fchk)


Lesenswert?

Nimm einen dsPIC33FJ128GP802. Der hat Stereo Audio mit DMA-Fähigkeit 
eingebaut. Die Audiosamples speicherst Du auf einem SPI-Flash, z.B. ST 
M25P80 (1 MByte, es gibt aus der Baureihe bei Bedarf auch noch größere). 
Der dsPIC hat differentielle Analogausgänge, hinter die Du OpAmps (zB 
MCP6024) schalten musst. Das steht aber alles im Datenblatt und den 
AppNotes drin. So kannst Du Deine Wörter und Phoneme in ziemlich guter 
Qualität abspielen.

fchk

von Max D. (max_d)


Lesenswert?

es gibt fertige sprechmodule im www, wenn es nicht gefordert ist würde 
ich mich erstmal mit sowas an die materie herantasten...

von Chr. M. (snowfly)


Lesenswert?

Hier:
Beitrag "Sprach IC Text to Speech (TTS)"
und hier:
http://www.avrfreaks.net/index.php?name=PNphpBB2&file=viewtopic&t=89761

und was Google sonst noch zu Text to Speech und Mikrocontroller 
ausspuckt.

von Andi (Gast)


Lesenswert?

Hallo
die ISD15xxx-Reihe von Nuvoton (früher Winbond) kann Sprachansagen in 
verschiedenen Längen und Qualitäten/Formaten
Also der ISD15108 ist der Chip mit der kleinsten Aufnahmedauer, ev. 
steht die 8 für 8min oder 8 MB, das hab ich vergessen.
Sind im TQFP, glaub die alten Serien im DIP sind alle abgekündigt.
Stichworte Chipcorder und voice ic
Gruß Andi

von Christian J. (chrisj) Benutzerseite


Lesenswert?

Hier ist so ein fertiges Sprachmodul, das man per UART ansteuern kann: 
https://www.sparkfun.com/products/11711 (allerdings nur Englisch und 
Spanisch)

Oder wie wäre es mit einem Embedded Linux Modul und eSpeak. eSpeak ist 
ein Open-Source-Sprach-Synthesizer, der Ausgaben in vielen Sprachen 
erzeugen kann. Z.B. über den Befehl "espeak -vde "zu sprechender Text". 
Allerdings klingt das etwas mechanisch.

Dann gibt es auch noch Festival "echo "This is a test." | festival 
--tts", die Sprachausgabe klingt besser, allerdings ist es komplizierter 
da die Deutsche Sprache zu installieren.

http://wiki.ubuntuusers.de/Sprachausgabe
http://wiki.ubuntuusers.de/Festival/Kompilieren
HOWTO: Make festival TTS use better voices (MBROLA  CMU  HTS): 
http://ubuntuforums.org/showthread.php?t=751169

von Manuel O. (idecmos)


Lesenswert?

Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber 
so ein modul bauen. Ich dachte man könnte per verschiedene ton höhen die 
einzelnen laute verwirklichen und wenn das ginge, dann würde ich das 
gerne nehmen. Außerdem würde ich lieber mir die eigenen libs schreiben. 
klar außer der Grafikkarte für das ich schon eine im auge haben.

von Udo S. (urschmitt)


Lesenswert?

Manuel O. schrieb:
> Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber
> so ein modul bauen. Ich dachte man könnte per verschiedene ton höhen die
> einzelnen laute verwirklichen

Wenn das so ginge würden das alle Navi Hersteller so machen statt ganze 
Worte oder zumindest Silben abzuspeichern. Und selbst dann klingt es oft 
holprig genug.

Wenn du meinst besser als die alle zu sein und das gut hinkriegst lass 
es dir patentieren und werde reich :-)

von Harald W. (wilhelms)


Lesenswert?

Manuel O. schrieb:

> Ok, erstmal danke für die vielen vorschläge. aber ich möchte mir selber
> so ein modul bauen.

Aha, also ein längeres Projekt. :-)

> Ich dachte man könnte per verschiedene ton höhen die
> einzelnen laute verwirklichen und wenn das ginge, dann würde ich das
> gerne nehmen.

Ich denke, Du wirst nicht drumherum kommen, einzelne Silben zu
speichern, und diese dann zu Wörtern zu kombinieren. Einfache
Buchstaben zu kombinieren, wird nicht klappen, es sei denn,
Du liebst buchstabierte Sprache.
Ge-er-uh-eszet
Ha-er-ah-el-de

: Bearbeitet durch User
von Mw E. (Firma: fritzler-avr.de) (fritzler)


Lesenswert?

Dann einfach mal deinem Navi zuhöhren und das so machen wie ich das oben 
beschrieben habe und beherzige mein Post weiter oben.

Nur mit Lauten ist dann doch schon etwas schwieriger.
Da ließ mal den Wikipediartikel zu "Vocaloid":
http://de.wikipedia.org/wiki/Vocaloid

von Manuel O. (idecmos)


Lesenswert?

Danke. Ich werde dann auch mal sowas selber ausprobieren.

von Mw E. (Firma: fritzler-avr.de) (fritzler)


Lesenswert?

Jo, kannste dir auch schonmal nen gutes Mikrophon kaufen zum Aufnahmen 
der einzelnen Wörter und Sprachfetzen.

Das Teil soll wirklich universell sein?
Oder reicht eine Ausgabe von gewissen Messwerten aus?
Dann isses um einiges einfacher.

von Manuel O. (idecmos)


Lesenswert?

Ok,also jetzt mal, tschuldigung das ich die warscheinlich wichtigsten 
sachen nocht gesagt habe. Ich möchte keine Aufnahmen nehmen sondern per 
code ausgeben. Das Modul sollte wenn es braucht auch cmos technik haben( 
und ich denke nicht das cmos = mikrocontroller ist). Ich dachte eben das 
man mit einem Oszilator und einem teiler das verwirklichen kann. in dem 
Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240 
MHz und einem teiler der bis zu 16 mal teilt vorgestellt und ich dachte 
das man das ganze so machen kann

von Mw E. (Firma: fritzler-avr.de) (fritzler)


Lesenswert?

Also gewisse Wortfetzen müssen schon vorhanden sein, totalsynthetisch 
ist richtig schwer.
Selbst bei Vocaloid mussten vorher Sänger ihre Stimme leihen.

von Frank K. (fchk)


Lesenswert?

Manuel O. schrieb:
> Ok,also jetzt mal, tschuldigung das ich die warscheinlich wichtigsten
> sachen nocht gesagt habe. Ich möchte keine Aufnahmen nehmen sondern per
> code ausgeben. Das Modul sollte wenn es braucht auch cmos technik haben(
> und ich denke nicht das cmos = mikrocontroller ist). Ich dachte eben das
> man mit einem Oszilator und einem teiler das verwirklichen kann. in dem
> Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240
> MHz und einem teiler der bis zu 16 mal teilt vorgestellt und ich dachte
> das man das ganze so machen kann

Da denkst Du falsch. So funktioniert Sprache nicht.

Was es gibt, ist das sogenannte Röhrenmodell, das die menschliche 
Stimmerzeugung nachbildet. Am Anfang steht ein Tongenerator 
(=Sfimmlippen), anschiend folgen verschiedene Röhren mit definierter 
Länge und Durchmesser (=Rachen, Mund,...). Das kann man mathematisch 
modellieren. Nutzt man im Mobilfunk für die Sprachdatenkompression. Für 
Dich ist das aber nicht praktikabel.

Mein Vorschlag mit dem Audio-dsPic ist der Weg, mit dem Du mit dem 
geringsten Hardwareaufwand die beste Qualität hinbekommst.

fchk

von Georg G. (df2au)


Lesenswert?

Manuel O. schrieb:
> in dem
> Cmos buch meines vater ist nähmlich ein soundmodul mit einem 2.000240
> MHz und einem teiler der bis zu 16 mal teilt vorgestellt

Früher war mal Phonem Synthese angesagt. Der SC-01-A von Votrax ist ein 
typischer Vertreter dieser Technik. Google findet das Datenblatt. Damals 
war Speicher knapp und MP3 noch nicht erfunden. Im Prinzip ist es "jeder 
Buchstabe ein Code". Aber damit es vernünftig klingt, muss man doch viel 
Arbeit reinstecken. Die Sprache ist dann ganz gut verständlich, klingt 
aber sehr nach Computer.

von Tom (Gast)


Lesenswert?

oha..sowas hatte ich damals auf meinem Schneider CPC6128 mal in Basic 
abgetippt..war nicht so einfach zu verstehen, wird aber sowas sein, was 
Du wohl gerne haben willst.
Da gibt es sicher doch besser Versionen auf heutigen µc..
Aber wo man da am besten nach Quellcode sucht..puhh.frag doch mal im 
Roboternetz, das klingt mir erstmal am naheliegensten

von Tom (Gast)


Lesenswert?


von Tom (Gast)


Lesenswert?

achne, sehen gerade das ist falsch, die haben da was spzezielles..es gab 
da jedenfalls auch nen Programm zwei A4 Seiten lang oder so..
Gibts sicher auch in C :-)

von Tom (Gast)


Lesenswert?


von Tom (Gast)


Lesenswert?

oh, in dem Lied von U96 das Boot war glaube ich der C64 bei der 
Sprachausgabe beteiligt
http://www.youtube.com/watch?v=Jx2FDZIvg_0

Sowas meinst Du doch?

von Manuel O. (idecmos)


Lesenswert?

Ja, Tom, Danke. Nur so aus interese. gibt es einen chip der sowas 
möglich macht

von Tom (Gast)


Lesenswert?

hachje..wenn Du schon direkt fragst :-)
http://www.speechchips.com/shop/

von Manuel O. (idecmos)


Lesenswert?

wie machen den das spielekonsolen. wie erzeugen die die sprache

von Tom (Gast)


Lesenswert?


von Manuel O. (idecmos)


Lesenswert?

danke tom für die schnelle antwort

von Tom (Gast)


Lesenswert?

wie gesagt, ich würde mal im Roboternet.de fragen, da sitzen die 
praktiker, da bekommst Du brauchbare Antworten, hier wird mehr warme 
Luft produziert als Hilfe geleistet

Vielelicht hat da einer einen Link zu einem fertigen code..wie gesgt, 
das Basicprogram war gar nicht mal soo lang...und sie Chips auf der 
Seite sind ja auch nur pics eben mit solch einem code drauf..mit etwas 
rumprobieren bekommst Du das sicher auch selber raus..aber bis man 
erstmal alle laute durhgeprobt hat, das währe mir zu blöd, hat ja alles 
chonmal wer gemacht darum sollte man nicht die zeit damit verschwenden 
immer wieder das Rad neu zu erfinden, ws hier viele aber ständig 
erwarten und daher nicht auf die Kette bekommen

von Manuel O. (idecmos)


Lesenswert?

Danke,
Ich schließe das jetzt mal das thema

von Manuel O. (idecmos)


Lesenswert?

kann bitte jemand diesen beitrag schliesen. Ich weiß nähmlich nicht wie 
das geht

von spess53 (Gast)


Lesenswert?

Hi

Nimm was fertiges:

http://www.sander-electronic.de/be00064.html

MfG Spess

von Manuel O. (idecmos)


Lesenswert?

Ich habe gerade im Wiki gelesen in welcher Frequenz die menschliche 
Stimme liegt. Mit ein bisschen Rechnen kann ich bestimmt einen 
Synthesizer bauen.

PS.: Ich habe im Betreff Gelöst geschrieben, dass man nichts mehr 
reinschreibt. Kann bitte wenn möglich jemand anderes das Thema schließen 
oder schreiben wie das geht. Ich würde mich darüber sehr freuen.

von Lothar M. (Firma: Titel) (lkmiller) (Moderator) Benutzerseite


Lesenswert?

Manuel O. schrieb:
> Ich habe gerade im Wiki gelesen in welcher Frequenz die menschliche
> Stimme liegt. Mit ein bisschen Rechnen kann ich bestimmt einen
> Synthesizer bauen.
Gewiss. Und den Prozess bis dahin nennt man "Lernen".

> PS.: Ich habe im Betreff Gelöst geschrieben, dass man nichts mehr
> reinschreibt. Kann bitte wenn möglich jemand anderes das Thema schließen
> oder schreiben wie das geht. Ich würde mich darüber sehr freuen.
Hier werden Threads nicht geschlossen. Du kannst auch einen 5 Jahre 
alten Thread nochmal ausgraben...

: Bearbeitet durch Moderator
von Harald W. (wilhelms)


Lesenswert?

Lothar Miller schrieb:

> Hier werden Threads nicht geschlossen. Du kannst auch einen 5 Jahre
> alten Thread nochmal ausgraben...

...was leider in diesem Forum viel zu gern gemacht wird...
Gruss
Harald

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.