mikrocontroller.net

Forum: Digitale Signalverarbeitung / DSP DSP & komplexe Multiplikation


Autor: Bogdan (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Gibt es einen DSP, der eine komplexe Multiplikation (32 Bit x 32 Bit) in 
10 ns ausführen kann?

Autor: Dergute Weka (derguteweka)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Moin,

Bestimmt gibts sowas.

Gruss
WK

Autor: Ralph Berres (rberres)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
wenn der DSP für die 32*32 Bit Multiplikation genau eine Taktperiode 
benötigt würde ein DSP mit 100MHz Taktfrequenz genügen.

Ich vermute aber mal das er mehr als eine Taktperiode benötigt.

Ob DSPs heute das mit einer Taktperiode können? und ob die so schnell 
sind?

Mit Fpgals könnte ich mir das schon eher vorstellen.

Ralph Berres

Autor: Nils P. (torus)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Aber sicher gibt es das:

Z.b kann der TMS320C6655 von Texas Instruments bei 1.25Ghz eine 
Multiplikation in 2.9ns berechnen. Die Multiplikation selbst hat eine 
Latenz von vier Zyklen.

Durch Pipelining kannst Du pro Cycle eine Multiplikation starten und Du 
hast zwei Multiplier Units. Damit kommst Du auf 8 aktive Multiplikatinen 
die zeitgleich aktiv sein können.

Das macht dann einen theoretischen Durchsatz von 10 Milliarden 
Multiplikatinen pro Sekunde.

Autor: Yalu X. (yalu) (Moderator)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Nils P. schrieb:
> TMS320C6655

Der hat sogar schon fertige Instruktionen für komplexe Operationen. Die
Multiplikation zweier komplexer 64-Bit-Zahlen (je 32 Bit Real- und
Imaginärteil, wahlweise Gleit- oder Festkomma) benötigt insgesamt 4
Zyklen, die sich durch Pipelining auf effektiv 1 Zyklus verkürzen
lassen. Die Operation kann parallel in zwei Recheneinheiten ausgeführt
werden, so dass jede komplexe Multiplikation im Mittel nur noch 0,5
Zyklen (0,4ns) benötigt.

Falls das nicht reicht, kann man mit der 8-Core-Variante TMS320C6678 den
Durchsatz noch einmal um den Faktor 8 steigern. Dann dauert die komplexe
Multiplikation im Mittel nur noch 50ps.

Autor: --- (Gast)
Datum:

Bewertung
-2 lesenswert
nicht lesenswert
> so dass jede komplexe Multiplikation im Mittel nur noch 0,5
> Zyklen (0,4ns) benötigt

Es sind auch nur Laien die ihren M4er ARM fuer einen DSP halten.

Autor: Klopsomat (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Yalu X. schrieb:
> Falls das nicht reicht, kann man mit der 8-Core-Variante TMS320C6678 den
> Durchsatz noch einmal um den Faktor 8 steigern.

Gerade mal nach den Preisen geschaut. Huch ...

Autor: chris (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
280$

Autor: Nils P. (torus)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Yalu X. schrieb:
> Falls das nicht reicht, kann man mit der 8-Core-Variante TMS320C6678 den
> Durchsatz noch einmal um den Faktor 8 steigern. Dann dauert die komplexe
> Multiplikation im Mittel nur noch 50ps.

Jup! Für so Low-Level Frickler wie mich sind diese Chips wirklich der 
ganz große Spaß.

Die wahre Kunst bei den Chips ist, die Daten schnell genug per DMA in 
das tightly coupled Memory zu bekommen. Sonst stallen die Pipelines und 
man sieht von der theoretischen Performance fast gar nichts.

Autor: Jürgen S. (engineer) Benutzerseite
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Yalu X. schrieb:
> Dann dauert die komplexe
> Multiplikation im Mittel nur noch 50ps.
SO kann man das aber nicht rechnen. :-)

Die Dauer einer Multiplikation ist schon die Zeit inklusive Latenz / 
Delay.

Dass infolge paralleler Berechnungen und pipelining (was auch auf 
Parallelität zurückzuführen ist!) ein hoher Datendurchsatz erzielt wird, 
macht die Dauer nicht kürzer. Das ist eine andere Kenngrösse.

Autor: Yalu X. (yalu) (Moderator)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Jürgen S. schrieb:
> Yalu X. schrieb:
>> Dann dauert die komplexe
>> Multiplikation im Mittel nur noch 50ps.
> SO kann man das aber nicht rechnen. :-)
>
> Die Dauer einer Multiplikation ist schon die Zeit inklusive Latenz /
> Delay.

Ja, hier von "Dauer" zu reden, ist schlampig. Ich wollte durch den
Zusatz "im Mittel" verdeutlichen, was gemeint ist, aber auch das ging in
die Hose. Eine bessere Formulierung wäre "bis zu 20 Milliarden komplexe
Multiplikation pro Sekunde" gewesen.

Autor: ossi-2 (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
> Dann dauert die komplexe
> Multiplikation im Mittel nur noch 50ps.
SO kann man das aber nicht rechnen. :-)

Für eine FFT würd ich das aber so rechnen wollen, weil genügend
Parallelität vorhanden ist, die Cores und die Pipelines darin eine
Zeitlang gefüllt zu halten. Dann spielt der Delay/die Latenz kaum noch 
eine Rolle.

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.