Fliesskomma Multiplikation möglichst in einem Takt ;)

von Holger K. (holgerkraehe)

06.12.2019 15:57

Lesenswert?

•

Hallo zusammen

Ich weiss, ich spame aktuell diese Kategorie etwas zu...

Multiplikationen im FPGA ohne entsprechende HW sind ja immer etwas 
heikel.
Daher, sieht jemand eine optimale (kurze Laufzeit) Möglichkeit, diese 
Berechnung durchzuführen?

(0.2126*R + 0.7152*G + 0.0722*B)

R, G und B sind jeweils Werte von 0..255

Danke!

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von foobar (Gast)

06.12.2019 16:05

Lesenswert?

•

▲
▼

Skalier sie mit einer Zweierpotenz so, dass genügend genaue Ganzzahlen 
herauskommen, z.B.: (109*R + 366*G + 37*B) / 512.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von dummschwaetzer (Gast)

06.12.2019 16:06

Lesenswert?

•

▲
▼

LUT, wird aber ziemlich groß 256*256*256 Einträge

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Wolfgang (Gast)

06.12.2019 16:07

Lesenswert?

•

▲
▼

Holger K. schrieb:
> Daher, sieht jemand eine optimale (kurze Laufzeit) Möglichkeit, diese
> Berechnung durchzuführen?

Festkommarechnung

(435*R + 1465*G + 148*B)/2048

Muss es auf vier Dezimalstellen genau sein?

Bei 2.4 Dezimalstellen für die Ausgabe scheinen das etwas übertriebene 
Anforderungen an die Rechnengenauigkeit zu sein.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Veit D. (devil-elec)

06.12.2019 16:47

Lesenswert?

•

▲
▼

Hallo,

wäre es nicht sinnvoller mit 10000 zu skalieren damit die Faktoren nicht 
verfälscht werden?


(2126*R + 7152*G + 722*B)/10000

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Wolfgang (Gast)

06.12.2019 16:57

Lesenswert?

•

▲
▼

Veit D. schrieb:
> wäre es nicht sinnvoller mit 10000 zu skalieren damit die Faktoren nicht
> verfälscht werden?

Nein, eine Division durch 10000 macht die Sache im Vergleich zu 
Zweierpotenzen nicht wirklich schneller.
Und die ganzen Nachkommastellen fallen bei der Ausgabe sowieso unter den 
Tisch.
Lernt man soetwas heutzutage in der Schule nicht mehr?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von c r (Gast)

06.12.2019 16:58

Lesenswert?

•

▲
▼

Veit D. schrieb:
> Hallo,
>
> wäre es nicht sinnvoller mit 10000 zu skalieren damit die Faktoren nicht
> verfälscht werden?

Ich kenne mich mit FPGAs nicht aus, aber ich schätze mal durch 2^n zu 
teilen kostet weniger (keine?) zusätzliche Zeit, weil man es durch ein 
nach rechts verschieben um n Bits ersetzen kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von foobar (Gast)

06.12.2019 16:59

Lesenswert?

•

▲
▼

Die Division mit einer Zweierpotenz ist wesentlich schneller und 
einfacher als mit einer Zehnerpotenz.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von rbx (Gast)

06.12.2019 17:28

Lesenswert?

•

▲
▼

http://www.iti.fh-flensburg.de/lang/algorithmen/arithmetik/karatsuba-multiplikation.htm

Karatsuba-Multiplikation Könnte man auch noch im Hinterkopf haben.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von TMS320C31 (Gast)

06.12.2019 18:23

Lesenswert?

•

▲
▼

Daruber lacht der nur.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Dergute W. (derguteweka)

06.12.2019 18:43

Lesenswert?

•

▲
▼

Moin,

Vielleicht mal einen Blick in die Entwicklungsumgebung werfen; Bei den 
IP-Cores fliegt evtl. sowas schon 'rum.
Und dann muss es doch auch nicht in einem Takt ablaufen, das kann doch 
prima "gepipelined" werden. Wen kratzt das denn, wenn die Pixel beim 
Farbe auf Schwarzweisswandeln ein paar Takte unterwegs sind?
Einfach die H,V und DE Signale auch durch ein paar Flipflops schicken 
und alles ist wieder beieinander.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Lothar M. (Firma: Titel) (lkmiller) (Moderator)

06.12.2019 18:59

Lesenswert?

•

▲
▼

c r schrieb:
> Veit D. schrieb:
>> wäre es nicht sinnvoller mit 10000 zu skalieren damit die Faktoren nicht
>> verfälscht werden?
Naja, ich denke, dass diese Zahlen nicht mit dem Hammer in Granit 
gemeißelt sind, und z.B ein Fehler in der 4. Nachkommastelle sich kaum 
schädlich auswirkt.
> Ich kenne mich mit FPGAs nicht aus, aber ich schätze mal durch 2^n zu
> teilen kostet weniger (keine?) zusätzliche Zeit, weil man es durch ein
> nach rechts verschieben um n Bits ersetzen kann.
Das wird im FPGA einfach nur anders verdrahtet, die unnötigen unteren 
Bits sind einfach nicht angeschlossen.

foobar schrieb:
> Die Division mit einer Zweierpotenz ist wesentlich schneller und
> einfacher als mit einer Zehnerpotenz.
Digitaltechnik ist für Prozessoren und Logik "normal". Damit was im 
Zehnersystem berechnen zu lassen ist wie wenn wir was im Siebenersystem 
ausrechnen müssten: halt echt umständlich und langsam.
Was ergibt beispielsweise 11x11 im 7er-System (also dezimal 8x8)? Wie 
lang hat die Berechnung gedauert? Und wie schnell berechnet sich das im 
Dezimalsystem?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von J. S. (engineer)

06.12.2019 19:27

Lesenswert?

•

▲
▼

Lothar M. schrieb:
> Naja, ich denke, dass diese Zahlen nicht mit dem Hammer in Granit
> gemeißelt sind, und z.B ein Fehler in der 4. Nachkommastelle sich kaum
> schädlich auswirkt.
Ja, das kann man wohl so festhalten :-)

Im Ernst: Fließkommaoperationen bei Video? Solche Rechnungen auf dem 
Level haben wir vor 30 Jahren auf dem C64 schon hinbekommen, als die 
Apfelmännchen gemalt wurden, mit weit höheren Genauigkeitsanforderungen.

Bei RGB-Werten, die aus Kameras kommen, sind selten mehr, als 10 Bit zu 
erwarten. Eine strenge Fehlerrechnung weist in Richtung 12 Bit als 
maximale Auflösung für die Koeffizienten, will man keinen zusätzlichen 
Fehler machen. Daher ist der Ansatz von Wolfgang sicher der 
zielführendste:

Wolfgang schrieb:
> (435*R + 1465*G + 148*B)/2048
... vielleicht noch 1 Bit mehr, wegen der Zahl 435, die nur geringfügig 
genauer ist, als der R-Wert, laut Aufgabenstellung des TE. Die scheinbar 
kleinste Zahl, 148, ist zwar auch nur auf 1/2 digit genau, passt aber zu 
der 2048 und liefert nicht mehr Fehler, als eine Skalierung mit 512.
Man könnte also sogar noch 1 Bit weniger nehmen, mit geringem 
tolerierbarem Fehler.

rbx schrieb:
> Karatsuba-Multiplikation Könnte man auch noch im Hinterkopf haben.
Für sehr viele Multiplikationen als pipeline in FPGAs mit Mangel an 
Multipliern, ja - ansonsten ist das ja hier eine schnudellige fixed 
coefficient MUL und noch dazu mit Werten wie 148, die gerade 3 
Additionen aufwerfen.:-)

Der Blauwert wäre also B*128 + B*16 + B*4, also durchaus in einem Takt 
zu machen.

Lothar M. schrieb:
> Das wird im FPGA einfach nur anders verdrahtet, die unnötigen unteren
> Bits sind einfach nicht angeschlossen.
Womit die Binärdivision mit einem Konstantfaktor in FPGAs die 
Schnellste, aller Grund-Rechenoperationen ist. Schneller, als "+" oder 
"-". Das vergessen Viele, wenn sie ihre Formeln für FPGAs optimieren. 
Selbst MATLAB hat da seine Probleme, naheliegende gute Lösungen zu 
finden. Immer wieder lustig, das mitanzusehen.

Das Einzige, was man manchmal braucht, ist Runden vor dem Abschneiden. 
Auch da haben einige komischerweise Probleme, das einzusehen und 
anzuwenden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von foobar (Gast)

06.12.2019 19:51

Lesenswert?

•

▲
▼

> Naja, ich denke, dass diese Zahlen nicht mit dem Hammer in Granit
> gemeißelt sind,

Jain, das sind Parameter zur RGB-nach-Luminanz-Umrechnung und in 
irgendwelchen Standards (mehr oder weniger willkürlich) spezifiziert.

Iirc, findet man das Triple [0.2126 0.7152 0.0722] unter anderem bei 
HDTV/BT.709, während SDTV/BT.601 das Triple [0.299 0.587 0.114] 
verwendet.  Ach, sind Standards nicht was Feines ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von VHDL hotline (Gast)

07.12.2019 13:23

Lesenswert?

•

▲
▼

dummschwaetzer schrieb:
> LUT, wird aber ziemlich groß 256*256*256 Einträge

3 256-Einträge LUTs mit anschließender Addition tun es auch. Im Prinzip 
ähnlich wie bei deiner anderen Frage: wenn irgendwo Konstanten 
vorkommen, ist vorinitialisierter Speicher eine effiziente Möglichkeit 
(zumindest für Xilinx FPGAs).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Vancouver (Gast)

07.12.2019 14:14

Lesenswert?

•

▲
▼

Integer-Konstantenmultiplikationen lassen sich gut in gepipelinete 
shift&add-Operationen zerlegen. Dafür eine DSP IP zu verwenden, grenzt 
schon an Verschwendung.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Fitzebutze (Gast)

08.12.2019 00:27

Lesenswert?

•

▲
▼

LUTs sind eine denkbar käsige Idee, siehe Rundungsfehler.
Fixpoint-Operationen sind dein Freund, 1.15 reicht typischerweise.
Fliesskomma-Units dafür zu instanzieren ist wiederum Käse.

Was den Einstieg in Fixpoint angeht, sind die Reference-Manuals zu den 
guten alten Blackfin-DSPs zu empfehlen, die erklären teils besser als so 
manches Lehrbuch.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Michael W. (Gast)

08.12.2019 12:01

Lesenswert?

•

▲
▼

Fitzebutze schrieb:
> LUTs sind eine denkbar käsige Idee, siehe Rundungsfehler.
> Fixpoint-Operationen sind dein Freund,

?

Wie wird denn eine FP-Operation praktisch realisiert, wenn nicht in 
LUTs?

Und wieso haben LUTs Rundungsfehler, die eine FP-Operation (angeblich) 
nicht hat?

?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Vancouver (Gast)

08.12.2019 21:16

Lesenswert?

•

▲
▼

Man unterscheide zwischen FPGA-Luts zur Berechnung von Logikfunktionen 
und Blockram-basierten Tabellen mit numerischen Werten.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Fliesskomma Multiplikation möglichst in einem Takt ;)

von Mampf F. (mampf)

23.12.2019 16:44

Lesenswert?

•

▲
▼

Holger K. schrieb:
> (0.2126*R + 0.7152*G + 0.0722*B)

Ich hatte für einen PAL-Encoder mal sowas gemacht.

Allerdings waren bei mir R, G und B keine 8Bit sondern nur jeweils 5Bit.

Und die Koeffizienten für die Multiplikation waren andere - die 
"offizielle" Formel ist ja die hier:

Y = 0,299*R + 0,587*G + 0,114*B

Aber deine Anwendung kenn ich natürlich nicht - wird sicherlich einen 
Grund haben, dass du andere Koeffizienten benutzt.

Naja, vielleicht kannst du trotzdem was mit der Source anfangen.

https://opencores.org/websvn/filedetails?repname=graphiti&path=%2Fgraphiti%2Ftrunk%2Fxilinx%2Frgb2yuv.vhd


*edit*: 45MHz auf einem Spartan 2 waren damals kein Problem (allerdings 
hatten mit 45MHz für PAL gereicht und ich hab nicht mehr ausprobiert). 
Wie schnell muss es denn bei dir sein?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: FPGA, VHDL & Co. Fliesskomma Multiplikation möglichst in einem Takt ;)