Forum: Mikrocontroller und Digitale Elektronik Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 14:51

Lesenswert?

•

▲
▼

Hallo zusammen,

neulich in einem Projekt (C++): es wurde ein Bottleneck ausgemacht, und 
zwar in der naiven Realisierung einer Skalierungsfunktion scale(): 
uint8_t:[min, max] -> [0, 100]:

uint8_t scale(uint8_t value, uint8_t min, uint8_t max) {
    return ((value - min) * 100) / (max - min);


Nachdem das klar war, wurde zunächst behauptet, dass man das nun in 
AVR-Assembler codieren müsse. Alle Einwände, doch zunächst ggf. andere 
Algorithmen in Betracht zu ziehen, wurden ignoriert.

Nun zur Frage, weil ich selbst kein AVR-Assembler-Experte bin: wer kann 
diese simple Skalierung in Assembler wesentlich performanter 
(CPU-Zyklen) machen? Alle (auch die fiesesten) Tricks sind erlaubt! Das 
ganze muss allerdings als (C)-Funktion aufrufbar sein, um als direkter 
Ersatz zu dienen.

Wer möchte, kann dies auch einfach als Coding-Challenge auffassen ...

Sorry, ich kann ja nur C++ ... Ich bin mir sicher, dass die 
Assemblerfraktion über dieses Problemchen nur müde lächelt!

Schon jetzt danke für Eure Hilfe!

Beitrag melden Bearbeiten Thread verschieben Thread entsperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5019412 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 14:56

Lesenswert?

•

▲
▼

so viel potenzial sehe ich da nicht. Wenn min und max konstanten sind 
könnte man etwas machen.

An der stelle frage ich mich viel mehr, warum so eine Funktion so oft 
aufgerufen wird, das sie ein Bottleneck ist. Da sollte man viel mehr 
darüber nachdenken die Umrechnung gar nicht erst zu machen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Detlev T. (detlevt)

23.05.2017 14:59

Lesenswert?

•

▲
▼

Ich vermute einmal, max und min ändern sich nicht ständig. Wie wäre es 
mit einer Tabelle für die 256 Möglichkeiten von value? (Geht auch in 
C++)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von FrickelFranz (Gast)

23.05.2017 15:00

Lesenswert?

•

▲
▼

Muss das so dynamisch sein? Können min / max als Konstanten zur 
Compilezeit festgelegt werden? Werden viele Aufrufe mit gleichem min / 
max nacheinander durchgeführt? Könnte man min max also für eine große 
Anzahl von Aufrufen vorher nur einmal übergeben?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Bernd K. (prof7bit)

23.05.2017 15:02

Lesenswert?

•

▲
▼

Wenn min und max über viele (alle?) Aufrufe hinweg gleich bleiben und es 
schnell sein muss würde ich auch mal über ne Lookup Tabelle nachdenken. 
Sind ja maximal nur 256 Werte.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Der Andere (Gast)

23.05.2017 15:03

Lesenswert?

•

▲
▼

Tipps wurden dir jetzt genügend genannt. Keiner davon ist auf assembler 
beschränkt, das geht alles mit c(++).
Also lieber TO, jetzt ist das DEIN coding-challenge

Zeig uns was du kannst!

:-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:04

Lesenswert?

•

▲
▼

FrickelFranz schrieb:
> Muss das so dynamisch sein? Können min / max als Konstanten zur
> Compilezeit festgelegt werden?

min und max sind bezogen auf einen Aufruf zwar konstant, d.h. sie 
entstammen aus festen Konfigurationswerten (je Modul), es kommen aber 
ganz unterschiedliche Konfigurationen in einem Compilat vor.

> Werden viele Aufrufe mit gleichem min /
> max nacheinander durchgeführt?

ja

> Könnte man min max also für eine große
> Anzahl von Aufrufen vorher nur einmal übergeben?

Das wäre dann eine stateful-Lösung: naja, ungern.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:06

Lesenswert?

•

▲
▼

Peter II schrieb:
> so viel potenzial sehe ich da nicht. Wenn min und max konstanten sind
> könnte man etwas machen.
>
> An der stelle frage ich mich viel mehr, warum so eine Funktion so oft
> aufgerufen wird, das sie ein Bottleneck ist. Da sollte man viel mehr
> darüber nachdenken die Umrechnung gar nicht erst zu machen.

Das stimmt (hatte ich oben eigentlich gesagt), doch die Frage war hier 
nach einem direkten Assembler Ersatz.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von o.p.x. (Gast)

23.05.2017 15:07

Lesenswert?

•

▲
▼

Naja. Wenn es wirklich ein Bottleneck ist und da sich eh alles im 8Bit 
Raum, und vielleicht sogar <100 abspielt, würde ich bei der Division mit 
einer Tabelle arbeiten.


return ( (value - min) * table[max - min] / 256);

Meine Erfahrung bei so einem Beispiel ist, dass es in Assembler 100% 
genauso schnell wie in C geht. Es gibt ein paar Außnahmen, wo es in 
Assembler etwas schneller wird. Hier wahrscheinlich nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:07

Lesenswert?

•

▲
▼

Detlev T. schrieb:
> Ich vermute einmal, max und min ändern sich nicht ständig. Wie wäre es
> mit einer Tabelle für die 256 Möglichkeiten von value? (Geht auch in
> C++)

Klar geht auch Lookup-Tabelle. Im Flash, ins RAM kopieren. Trade-off: 
Speed <-> Space?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 15:07

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Das stimmt (hatte ich oben eigentlich gesagt), doch die Frage war hier
> nach einem direkten Assembler Ersatz.

aber was bring ein  Assembler Ersatz der nicht schneller ist?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:08

Lesenswert?

•

▲
▼

Der Andere schrieb:
> Tipps wurden dir jetzt genügend genannt. Keiner davon ist auf assembler
> beschränkt, das geht alles mit c(++).
> Also lieber TO, jetzt ist das DEIN coding-challenge
>
> Zeig uns was du kannst!
>
> :-)

Bezogen auf die Posts vor Deinem, wurde hier nur Lookup-Tabelle und 
min/max als Konstanten genannt. Damit habe ich kein Problem ... meine 
Lösung kommt, sobald ich mal eine Assembler-Lösung als baseline habe.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

23.05.2017 15:09

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Sorry, ich kann ja nur C++

Ich sehe da oben sogar nur C.

Übrigens: Wenn es möglich ist, vor die Definition der Funktion das 
Wörtchen "static" zu schreiben, dann tue es. Dann wird der gcc bzgl. 
Inlining wesentlich aggressiver.

Das kann ich übrigens generell empfehlen: Funktionen, die nur in einer 
Übersetzungseinheit verwendet werden, sollten man auch immer static 
definieren. Das bringt für den Compiler dann ganz andere 
Optimierungsmöglichkeiten.

(Okay, bei LTO ist es wieder schnuppe, aber nur dann).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:09

Lesenswert?

•

▲
▼

Peter II schrieb:
> Wilhelm M. schrieb:
>> Das stimmt (hatte ich oben eigentlich gesagt), doch die Frage war hier
>> nach einem direkten Assembler Ersatz.
>
> aber was bring ein  Assembler Ersatz der nicht schneller ist?

Natürlich nix! Es geht ja nur darum zu schauen, ob eine Assembler-Lösung 
schneller sein kann.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von FrickelFranz (Gast)

23.05.2017 15:12

Lesenswert?

•

▲
▼

Ich gehe sogar noch einen Schritt weiter als static: Für sowas könnte 
man auch die Funktion böse mit 'inline' in den Header packen, Variablen 
an Register binden. Braucht alles kein Assembler, aber kann den Overead 
des Aufrufs optimieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:13

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Wilhelm M. schrieb:
>> Sorry, ich kann ja nur C++
>
> Ich sehe da oben sogar nur C.

In diesem Fall identisch ...

> Übrigens: Wenn es möglich ist, vor die Definition der Funktion das
> Wörtchen "static" zu schreiben, dann tue es. Dann wird der gcc bzgl.
> Inlining wesentlich aggressiver.

Auch klar, es ging aber hier eher um den Körper der Funktion ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:15

Lesenswert?

•

▲
▼

FrickelFranz schrieb:
> Ich gehe sogar noch einen Schritt weiter als static: Für sowas könnte
> man auch die Funktion böse mit 'inline' in den Header packen, Variablen
> an Register binden. Braucht alles kein Assembler, aber kann den Overead
> des Aufrufs optimieren.

Auch ok. Würdest Du das mal ausformulieren?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Alexander B. (Firma: brickwedde.dev) (alexbrickwedde)

23.05.2017 15:16

Lesenswert?

•

▲
▼

o.p.x. schrieb:
> return ( (value - min) * table[max - min] / 256);

Statt "/ 256" aber lieber ">> 8", oder???

return ( ((uint16_t)(value - min)) * table[max - min]) >> 8;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 15:17

Lesenswert?

•

▲
▼

FrickelFranz schrieb:
> Braucht alles kein Assembler, aber kann den Overead
> des Aufrufs optimieren.

aber wie viel macht der Aufruf im Verhältnis zu Division aus? 0.1%??

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

23.05.2017 15:17

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Auch klar, es ging aber hier eher um den Körper der Funktion ...

Ehrlich gesagt: Seitdem ich die STM32 für mich entdeckt habe, kommen mir 
solche Problemstellungen wie "Da ist ein Bottleneck im AVR-Code, das 
dringend mit Assembler gefixt werden muss" einfach nur noch lächerlich 
vor.

Solche Anstrengungen kosten nur viel Zeit, sonst nichts.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:21

Lesenswert?

•

▲
▼

Alexander B. schrieb:
> o.p.x. schrieb:
>> return ( (value - min) * table[max - min] / 256);
>
> Statt "/ 256" aber lieber ">> 8", oder???
>
> return ( ((uint16_t)(value - min)) * table[max - min]) >> 8;

Soweit ich das bislang gesehen habe, wird die Division in 2'er-Potenzen 
vom Compiler eh als shift optimiert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Gu. F. (mitleser)

23.05.2017 15:26

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> uint8_t scale(uint8_t value, uint8_t min, uint8_t max) {
>     return ((value - min) * 100) / (max - min);
> }

Evtl. statt "max" das delta zu min übergeben, spart zumindest die 
Subtraktion

uint8_t scale(uint8_t value, uint8_t min, uint8_t delta) 
    return ((value - min) * 100) / delta;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Pete K. (pete77)

23.05.2017 15:30

Lesenswert?

•

▲
▼

Hast Du Dir denn mal das Assemblerlisting zu Deinem Programm angeschaut? 
Auch C++ wird vor der Ausführung in Assembler übersetzt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Amateur (Gast)

23.05.2017 15:36

Lesenswert?

•

▲
▼

Hast Du mal probiert, das Ganze als Inline-Funktion zu deklarieren?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Assemblator (Gast)

23.05.2017 15:36

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Es geht ja nur darum zu schauen, ob eine Assembler-Lösung
> schneller sein kann.

Wird dieser Unsinn jemals auszurotten sein? Wiese sollte von Hand 
erstellter Assembler schneller sein, als es die Ausgabe eines Compilers 
ist? Soll der Compiler absichtlich langsamen Code generieren oder welche 
Vorstellung steckt hinter solchen Ideen?

Es gibt genau eine Möglichkeit, wie das funktionieren kann: Man 
berücksichtigt in Assembler zusätzliche, vereinfachende Randbedingungen, 
die man (aus reiner Bosheit - muss ich annehmen) dem C/C++-Compiler 
vorenthalten hat. Das hat aber nichts mit Assembler zu tun.

Solche Randbedingungen machen hier im günstigsten Fall die 
Multiplikation und Division obsolet und sind aus der abstrakten 
Problembeschreibung natürlich nicht zu entnehmen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:39

Lesenswert?

•

▲
▼

Pete K. schrieb:
> Hast Du Dir denn mal das Assemblerlisting zu Deinem Programm angeschaut?
> Auch C++ wird vor der Ausführung in Assembler übersetzt.

Na klar. Die Funktion wird generiert mit Prolog und Epilog, aber auch 
brav inline'd. Sie macht ein call __divmodhi4 bzw. mul.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 15:40

Lesenswert?

•

▲
▼

Assemblator schrieb:
> Wird dieser Unsinn jemals auszurotten sein? Wiese sollte von Hand
> erstellter Assembler schneller sein, als es die Ausgabe eines Compilers
> ist? Soll der Compiler absichtlich langsamen Code generieren oder welche
> Vorstellung steckt hinter solchen Ideen?

ja, der ASM code ist fast nie perfekt. Man kann so gut wie immer etwas 
verbessern nur macht es wenig sinn.
Ich behaupte mal in jeden größeren Programm gibt es stellen die der 
Mensch besser mit ASM machen könnte, nur lohnt sich es da nicht.

In fast jeder neue Compiler Version, wird die code kleiner, also war er 
vorher zu groß. Das zeigt doch schon, das Compiler noch lange nicht 
perfekt sind.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:43

Lesenswert?

•

▲
▼

Assemblator schrieb:
> Wilhelm M. schrieb:
>> Es geht ja nur darum zu schauen, ob eine Assembler-Lösung
>> schneller sein kann.
>
> Wird dieser Unsinn jemals auszurotten sein? Wiese sollte von Hand
> erstellter Assembler schneller sein, als es die Ausgabe eines Compilers
> ist? Soll der Compiler absichtlich langsamen Code generieren oder welche
> Vorstellung steckt hinter solchen Ideen?

Ganz meine Meinung!
Es gibt aber hier wie auch in dem besagten Projekt Leute, die von dieser 
Meinung nicht abzubringen sind. Und deswegen die Frage an diejenigen, 
die Assembler-Spezis sind, da mal einen Ansatz zu liefern.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 15:44

Lesenswert?

•

▲
▼

Peter II schrieb:
> Assemblator schrieb:
>> Wird dieser Unsinn jemals auszurotten sein? Wiese sollte von Hand
>> erstellter Assembler schneller sein, als es die Ausgabe eines Compilers
>> ist? Soll der Compiler absichtlich langsamen Code generieren oder welche
>> Vorstellung steckt hinter solchen Ideen?
>
> ja, der ASM code ist fast nie perfekt. Man kann so gut wie immer etwas
> verbessern nur macht es wenig sinn.
> Ich behaupte mal in jeden größeren Programm gibt es stellen die der
> Mensch besser mit ASM machen könnte, nur lohnt sich es da nicht.

Ist dies so eine Stelle?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 15:52

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ist dies so eine Stelle?

nein, wie schon oben geschrieben.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

23.05.2017 15:53

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich behaupte mal in jeden größeren Programm gibt es stellen die der
> Mensch besser mit ASM machen könnte, nur lohnt sich es da nicht.

Ich behaupte mal: Je größer der Programmumfang ist, desto schlechter 
wird der Assembler-Programmierer gegenüber dem C-Compiler abschneiden. 
Der Assembler-Programmierer verliert irgendwann den Überblick, der 
Compiler nicht - ganz im Gegenteil.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von 2⁵ (Gast)

23.05.2017 15:55

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Ehrlich gesagt: Seitdem ich die STM32 für mich entdeckt habe, kommen mir
> solche Problemstellungen wie "Da ist ein Bottleneck im AVR-Code, das
> dringend mit Assembler gefixt werden muss" einfach nur noch lächerlich
> vor.

Aber Hallo! Hier die ARM Version: (arm-none-eabi-gcc -mcpu=cortex-m3 
-mthumb -O3 -S scale.c, gcc 6.3.1)

        @ args = 0, pretend = 0, frame = 0
        @ frame_needed = 0, uses_anonymous_args = 0
        @ link register save eliminated.
        movs    r3, #100
        subs    r0, r0, r1
        mul     r3, r3, r0
        subs    r2, r2, r1
        sdiv    r3, r3, r2
        uxtb    r0, r3


Hier die AVR (avr-gcc -O3 -S scale.c, leider nur 4.9.2)

/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
        mov r30,r22
        ldi r31,0
        mov r18,r24
        ldi r19,0
        sub r18,r30
        sbc r19,r31
        mov r24,r18
        mov r25,r19
        lsl r24
        rol r25
        add r24,r18
        adc r25,r19
        mov r22,r24
        mov r23,r25
        lsl r22
        rol r23
        swap r22
        swap r23
        andi r23,0xf0
        eor r23,r22
        andi r22,0xf0
        eor r23,r22
        add r24,r22
        adc r25,r23
        add r24,r18
        adc r25,r19
        mov r22,r20
        ldi r23,0
        sub r22,r30
        sbc r23,r31
        rcall __divmodhi4
        mov r24,r22
        ret

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 15:57

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Ich behaupte mal: Je größer der Programmumfang ist, desto schlechter
> wird der Assembler-Programmierer gegenüber dem C-Compiler abschneiden.
> Der Assembler-Programmierer verliert irgendwann den Überblick, der
> Compiler nicht - ganz im Gegenteil.

Beispiel:
beim AVR nutzt der Compiler keine Register für globale variablen. Er hat 
ein paar Register wo feste werte drin stehe, das war's aber auch.

Wenn man ein uint8_t an viele stellen im Programm verwendet (und auch 
noch in der ISR) dann muss man mit volatile arbeiten - was ganz 
schlechten code erzeugt. Ein ASM-Coder nimmt dafür ein festes Register.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 16:03

Lesenswert?

•

▲
▼

2⁵ schrieb:
> Frank M. schrieb:
>> Ehrlich gesagt: Seitdem ich die STM32 für mich entdeckt habe, kommen mir
>> solche Problemstellungen wie "Da ist ein Bottleneck im AVR-Code, das
>> dringend mit Assembler gefixt werden muss" einfach nur noch lächerlich
>> vor.
>
> Aber Hallo! Hier die ARM Version: (arm-none-eabi-gcc -mcpu=cortex-m3
> -mthumb -O3 -S scale.c, gcc 6.3.1)


Danke, den AVR-Code habe ich ja ... und der Vergleich zu ARM ist zwar 
interessant, aber weder anders zu erwarten noch an dieser Stelle gefragt 
;-(

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 16:04

Lesenswert?

•

▲
▼

Nicht, dass ihr denkt, der TO ist verschwunden: melde mich jetzt mal für 
die Heimfahrt ab ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von FrickelFranz (Gast)

23.05.2017 16:08

Lesenswert?

•

▲
▼

Peter II schrieb:
> Wenn man ein uint8_t an viele stellen im Programm verwendet (und auch
> noch in der ISR) dann muss man mit volatile arbeiten - was ganz
> schlechten code erzeugt. Ein ASM-Coder nimmt dafür ein festes Register.

Ja. Man kann dem Compiler aber ein wenig helfen.

In einer *.h Datei:

register uint8_t min asm("r3");
register uint8_t max asm("r4");
inline uint8_t scale(const uint8_t value) {
    return ((value - min) * 100) / (max - min);


Der obige Code führt selbstverständlich zu einem Desaster, wenn sich 
verschiedene Programmteile wie Mainprogramm, ISR ... drum kloppen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

23.05.2017 16:13

Lesenswert?

•

▲
▼

FrickelFranz schrieb:
> Ja. Man kann dem Compiler aber ein wenig helfen.
> register uint8_t max asm("r4");

nicht wirklich. Zum rechnen kopiert der Compiler R4 in ein anderes 
Register und kopiert es dann zurück. (war zumindest bei Gcc 4.x der 
fall)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von eProfi (Gast)

23.05.2017 16:16

Lesenswert?

•

▲
▼

Die erste Frage ist sowieso, wo kommt dieses elende 100 her
die zweite Frage ist, wie oft ändert sich min und max.

Wahrscheinlich lohnt es sich, daraus on the fly eine direkte 
Lookup-Table zu erstellen und danach gar nicht mehr zu rechnen.
Dazu braucht man aber mehr Infos und Code.

Allgemein: Optimieren kann man manuell immer, das muss nicht nur 
Assembler sein, sondern betrifft den Lösungsansatz und die ganze 
Programmstruktur.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Der Andere (Gast)

23.05.2017 16:22

Lesenswert?

•

▲
▼

eProfi schrieb:
> Wahrscheinlich lohnt es sich, daraus on the fly eine direkte
> Lookup-Table zu erstellen und danach gar nicht mehr zu rechnen.
> Dazu braucht man aber mehr Infos und Code.

Das wurde schon in den ersten Beiträgen vorgeschlagen.
Der TO hat hier aber schon mehr Zeit investiert den Thread am Leben zu 
erhalten, als es gebraucht hätte das Ganze mal schnell in seiner 
Programmiersprache auszutesten.

Auch die seltsamen Erklärungen warum es unbedingt in ASM sein muss 
weisen stark auf einen Troll hin

Viel Spass also beim weiter auf den Leim gehen.
:-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter D. (peda)

23.05.2017 16:22

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich bin mir sicher, dass die
> Assemblerfraktion über dieses Problemchen nur müde lächelt!

Was fürn Quatsch.
Schau Dir mal die Assembler-Division in den AVR-Notes an. Die ist so, 
wie es jeder Anfänger in der Schule gelernt hat. Also viel langsamer, 
als der Compilercode. Den haben nämlich pfiffige Kerlchen gebaut.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Guardian (Gast)

23.05.2017 16:58

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Das
> ganze muss allerdings als (C)-Funktion aufrufbar sein, um als direkter
> Ersatz zu dienen.

Ja nach welchen calling conventions? Gerade da verplempern 
Objektorientierte Ansätze u.U. viel. (bspw. stack statt registeroperand)
Und Assembler kann gegenüber den suboptimalen register allocation algos 
der Compiler punkten.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von FrickelFranz (Gast)

23.05.2017 16:59

Lesenswert?

•

▲
▼

Peter II schrieb:
> Zum rechnen kopiert der Compiler R4 in ein anderes
> Register und kopiert es dann zurück. (war zumindest bei Gcc 4.x der
> fall)

Ja, dieser Quatsch ist mir auch schon mal aufgestoßen. Aber vielleicht 
kann man den Compiler so wenigstens davon abhalten mit dem Register den 
Stack zu poppen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von S. R. (svenska)

23.05.2017 18:30

Lesenswert?

•

▲
▼

Wenn 'min' und 'max' pro Modul konstant sind und der TO ohnehin mit C++ 
arbeitet, dann ist die Lösung doch offensichtlich: Templates.

Für jedes Modul wird einfach eine optimale (weil konstante 
min/max-Werte) scale()-Funktion instantiiert, gut ist. Die eine, die 
sich als Performance-Problem erweist, wird dann noch als LUT speziell 
implementiert, fertig.

Für das gegebene Problem ist Assembler die Antwort auf die falsche 
Frage.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5019708 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von PittyJ (Gast)

23.05.2017 18:37

Lesenswert?

•

▲
▼

Die 100 wird wohl nur für eine dem Menschen passende Skalierung 
gebraucht.
Und da ein Mensch eh nur in der Lage ist, ein Dutzend Werte die Sekunde 
zu erkennen, ist das alles völlig überflüssig.

Einfach nur die Rohwerte binär speichern. Und wenn wirklich mal eine 
Ausgabe gebraucht wird, dann reicht die Leistung auch für die paar 
Werte.

Macht lieber was schönes, als bei sowas noch Takte zu sparen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

23.05.2017 19:00

Lesenswert?

•

▲
▼

Nachdem viel über Sinn oder Unsinn der Optimierung dieser Routine
geschrieben worden ist (ich selber stimme auch eher für Unsinn :)),
habe ich trotzdem mal ein Stückchen Code geschrieben, das (hoffentlich)
Wilhelms Vorstellungen entspricht.

Unter der Annahme, dass für value, min und max sinnvolle Werte übergeben
werden, also

  min < max

und

  min ≤ value ≤ max

sollte sie exakt die gleichen Ergebnisse liefern wie das Original¹.

.global scale
  sub  r20,r22
  sub  r24,r22
  ldi  r25,100
  mul  r24,r25
  movw r30,r0
  ldi  r25,0x40
  ldi  r24,0
  mov  r21,r24
  or   r21,r25
  mul  r21,r20
  movw r22,r0
  cp   r30,r22
  cpc  r31,r23
  brlo skip
  mov  r24,r21
  breq leave
  lsr  r25
  brne loop
  clr  r1


Sie ist – abhängig von den Argumenten – etwa um den Faktor 2 bis 9
schneller als das Original. Im Mittel wird der Faktor wohl bei knapp 3
liegen, das ist aber nur geschätzt.

Sie ist so geschrieben, dass sie – in eine .s-Datei gepackt – direkt in
ein AVR-GCC-Projekt eingebunden und von C aus aufgerufen werden kann.

————————————
¹) Falls nicht (ich konnte sie leider nicht vernünftig testen), bitte
   Beispiele posten, für die das Ergebnis falsch ist, ich werde dann
   nachbessern :)


PS: Natürlich kann man diese Routine zurück nach C übersetzen, dann ist
sie immer noch schneller als das Original, aber trotzdem nicht ganz so
schnell wie in Assembler. Die Frage ist halt immer, wieviel Aufwand man
– zusätzlich zu einer C-Optimierung – in eine Assembler-Optimierung
stecken möchte, die den Code vielleicht gerade mal um 20% schneller
macht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 19:32

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Nachdem viel über Sinn oder Unsinn der Optimierung dieser Routine
> geschrieben worden ist (ich selber stimme auch eher für Unsinn :)),

Wie gesagt: ich halte es ja auch für Unsinn, doch andere bestanden 
darauf.

@Yalu: Du bist also der erste, der wirklich mal was in ASM codiert hat! 
Danke dafür! Ich baue das gleich in den Test ein und sende dann die 
Ergebnisse.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von S. Landolt (Gast)

23.05.2017 19:34

Lesenswert?

•

▲
▼

Weshalb erfolgt in der Schleife das Umspeichern mit

1	movw r22,r0

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

23.05.2017 19:47

Lesenswert?

•

▲
▼

S. Landolt schrieb:
> Weshalb erfolgt in der Schleife das Umspeichern mit
>
> movw r22,r0

Gute Frage :)

Ja, da kann man nochmals bis zu 7 Zyklen einsparen. Danke für den Tipp!

Das ganze geht übrigens auch ohne MUL-Befehl (für die kleinen AVRs) und
ist damit nur unwesentlich langsamer. Bevor ich etwas dazu poste, warte
ich aber erst mal Wilhelms Testbereicht ab.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 19:52

Angehängte Dateien:

percent.h (3 KB) | Codeansicht
bm30a.cc (7,3 KB)

Lesenswert?

•

▲
▼

Folgende Varianten:

1) Naiv,              uint8_t,  variabel
2) Naiv,              template, variabel
3) Division/Addieren, uint8_t,  fest
4) FastScale,         template, fest     (wie Division/Addieren)
5) Lookup,            template, variabel
6) Lookup,            template, fest
7) asm,               uint8_t,  variabel (ohne range check)

Hier die Codegrößen:

   text    data     bss     dec     hex filename
    338       2       1     341     155 bm31a.elf
    290       2       1     293     125 bm32a.elf
    212       2       1     215      d7 bm33a.elf
    212       2       1     215      d7 bm34a.elf
    520       2     143     665     299 bm35a.elf
    192     514       1     707     2c3 bm36a.elf
    234       2       1     237      ed bm37a.elf

Und hier die Ausführungszeiten:

O:1 : 196ms
O:2 : 201ms
O:3 : 21ms
O:4 : 22ms
O:5 : 38ms
O:6 : 17ms
O:7 : 99ms

Der Code ist angehängt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jobst M. (jobstens-de)

23.05.2017 20:25

Lesenswert?

•

▲
▼

Sinngemäß würde ich folgendes machen:

#1x - wenn nötig:
uint16_t merker = 25600 / (max - min);
Und dann viele Male:
uint8_t scale(uint8_t value, uint8_t min, uint16_t merker) {
    return uint8(((value - min) * merker)>>8); # Nur oberes Byte der Multiplikation
Also sowas in ASM:
SUB value, min
MUL value, high(merker)
MOV tmp, R0
MUL value, low(merker)
ADD R1, tmp
return R1


... sollte auch ein C-Compiler etwas brauchbares draus zaubern ...

Allerdings bezweifele ich auch ein wenig, dass das der Flaschenhals ist 
...


**Edit: Korrektur R0/R1


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ingo Less (Gast)

23.05.2017 20:58

Lesenswert?

•

▲
▼

Ich bin ja mal gespannt nach wie vielen Stunde unser c-hater den 
perfekten asm-code raushaut. Der benötigt dann warscheinlich 1ms 
Ausführungszeit

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jobst M. (jobstens-de)

23.05.2017 21:02

Lesenswert?

•

▲
▼

Mit wie vielen kHz läuft der Controller? :-D


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:04

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Mit wie vielen kHz läuft der Controller? :-D

Ist doch egal: es geht doch um die relative Geschwindigkeit! 
(simavr@12Mhz)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:08

Lesenswert?

•

▲
▼

Ingo Less schrieb:
> Ich bin ja mal gespannt nach wie vielen Stunde unser c-hater den
> perfekten asm-code raushaut. Der benötigt dann warscheinlich 1ms
> Ausführungszeit

Ja, ich auch ... (aber vllt sollte er den Namen dann auf C++-Hater 
ändern)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von A. S. (Gast)

23.05.2017 21:11

Lesenswert?

•

▲
▼

Wenn die Ursprungs-Rechnung in Assembler schlagbar ist, dann doch nur 
aufgrund der Probleme der Integral Promotion --> signed --> 
Sonderbehandlung.

Die also entweder abschalten oder ins leere laufen lassen. und natürlich 
das delta von

Gu. F. schrieb:
> delta

a)
uint8_t scale(uint16_t value, uint16_t min, uint16_t delta) {
    return ((value - min) * 100) / (delta);
}


b) ggf. noch die *100 aufgedröselt, je nach Rechenkosten des µC
uint8_t scale(uint16_t value, uint16_t min, uint16_t delta) {
uint16_t v = (value-min)<<2;
uint16_t v32 = v<<3;

    v+=v32;
    v+=v32;
    v+=v32;
    return v/delta;
}

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jobst M. (jobstens-de)

23.05.2017 21:18

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> (simavr@12Mhz)

Gut, das hier geht dann in unter 1µs (7Takte):

Jobst M. schrieb:
> Also sowas in ASM:
> SUB value, min
> MUL value, high(merker)
> MOV tmp, R0
> MUL value, low(merker)
> ADD R1, tmp
> return R1

Die Frage ist eben einfach, wie häufig Du

Jobst M. schrieb:
> uint16_t merker = 25600 / (max - min);

ausrechnen musst. Also wie oft sich Dein max und min verändert.


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:36

Lesenswert?

•

▲
▼

Jobst M. schrieb:

>
> Die Frage ist eben einfach, wie häufig Du
>
> Jobst M. schrieb:
>> uint16_t merker = 25600 / (max - min);
>
> ausrechnen musst. Also wie oft sich Dein max und min verändert.

Mach einfach - ggf. auch eine statefull -  Asm-Routine, dann baue ich 
sie in den Benchmark ein.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 21:37

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Pete K. schrieb:
>> Hast Du Dir denn mal das Assemblerlisting zu Deinem Programm angeschaut?
>> Auch C++ wird vor der Ausführung in Assembler übersetzt.
>
> Na klar. Die Funktion wird generiert mit Prolog und Epilog, aber auch
> brav inline'd. Sie macht ein call __divmodhi4 bzw. mul.

Das liegt daran, dass du signed rechnest.  Falls eine unsigned 
berechnung ok ist, dann nimm unsigned.  Da ist dann die Chance besser, 
dass der Compiler ne Division dirch Konstante als Multiplikation 
abbildet.  Dazu:

1) Als static inline schreiben, wurde ja schon genannt.  Falls das nicht
   zu Inlining führt dann zusätzlich __attribute__((_always_inline_)).

2) Alle betroffenen Module mit -O2 übersetzen.

Wenn das alles nicht hilft kann man einen anderen Algorithmus überlegen, 
da gibt's i.w. 2 Möglichkeiten.  Die Division in Assembler machen ist 
Käse da __[u]divmodXX4 bereits in Assembler steht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:38

Lesenswert?

•

▲
▼

Der Andere schrieb:

> Der TO hat hier aber schon mehr Zeit investiert den Thread am Leben zu
> erhalten, als es gebraucht hätte das Ganze mal schnell in seiner
> Programmiersprache auszutesten.

Ich habe lediglich auf Fragen geantwortet. Und das hat nichts damit zu 
tun, ein Thema künstlich am Leben zu erhalten.

>
> Auch die seltsamen Erklärungen warum es unbedingt in ASM sein muss
> weisen stark auf einen Troll hin

Die Aussage war doch klar. Was soll das?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Michael H. (dowjones)

23.05.2017 21:46

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich bin mir sicher, dass die
> Assemblerfraktion über dieses Problemchen nur müde lächelt!

Hast du mal geschaut wie unsere "Altvorderen" das gemacht haben? Vor 
30-50 Jahren war es ja Gang und Gäbe alles in Assembler zu schreiben, da 
wäre doch zu erwarten das die Jungs damals auch ausgefuchste Routinen 
zur Division entwickelt haben, welche um jedes Byte/Zyklus kämpften.
Ad hoc fallen wir da die Seiten
- http://www.6502.org/source/
- http://codebase64.org/doku.php?id=base:6502_6510_maths
ein, bei denen man mal schauen könnte ob es dort etwas brauchbares gibt. 
Die sind zwar nicht für AVR-Assembler, aber die Ideen sollte man doch 
übertragen können.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 21:47

Lesenswert?

•

▲
▼

...hier mal ein Beispiel unter obiger Annahme:

static inline
uint8_t scale (uint8_t value, uint8_t min, uint8_t max)
    return ((value - min) * 100u) / ((uint16_t) (uint8_t)(max - min));
uint8_t scale1 (uint8_t value)
    return scale (value, 100, 21);


 
wird qua avr-gcc v6 -O2 zu

/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
  ldi r25,0   ;  28  movqi_insn/1  [length = 1]
  subi r24,100   ;  7  addhi3_clobber/2  [length = 2]
  sbc r25,__zero_reg__
  ldi r18,lo8(100)   ;  8  movqi_insn/2  [length = 1]
  mul r18,r24   ;  9  muluqihi3  [length = 5]
  movw r20,r0
  mul r18,r25
  add r21,r0
  clr __zero_reg__
  movw r18,r20   ;  10  *movhi/1  [length = 1]
  ldi r26,lo8(67)   ;  11  *movhi/5  [length = 2]
  ldi r27,lo8(114)
  call __umulhisi3   ;  12  *umulhi3_highpart_call  [length = 2]
  sub r20,r24   ;  14  subhi3/1  [length = 2]
  sbc r21,r25
  lsr r21   ;  32  *lshrhi3_const/2  [length = 2]
  ror r20
  add r24,r20   ;  16  *addhi3/1  [length = 2]
  adc r25,r21
  lsl r24   ;  33  *lshrhi3_const/5  [length = 5]
  mov r24,r25
  rol r24
  sbc r25,r25
  neg r25
  ret   ;  31  return  [length = 1]

 
Die Konstante in insn 11 willst du garantiert nicht in Assembler 
eruieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:48

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Wilhelm M. schrieb:
>> Pete K. schrieb:
>>> Hast Du Dir denn mal das Assemblerlisting zu Deinem Programm angeschaut?
>>> Auch C++ wird vor der Ausführung in Assembler übersetzt.
>>
>> Na klar. Die Funktion wird generiert mit Prolog und Epilog, aber auch
>> brav inline'd. Sie macht ein call __divmodhi4 bzw. mul.
>
> Das liegt daran, dass du signed rechnest.  Falls eine unsigned
> berechnung ok ist, dann nimm unsigned.

Ok, habe die Konstanten noch auf 100U geändert. Dann wird auch call 
__udivmodhi4, was aber nichts an der messbaren Laufzeit ändert.


> Da ist dann die Chance besser,
> dass der Compiler ne Division dirch Konstante als Multiplikation
> abbildet.  Dazu:
>
> 1) Als static inline schreiben, wurde ja schon genannt.  Falls das nicht
>    zu Inlining führt dann zusätzlich __attribute__((_always_inline_)).

Ich hatte schon geschrieben, dass das Inlining stattfindet. Bei den 
templates ja eh ...

> 2) Alle betroffenen Module mit -O2 übersetzen.

Sind alle mit O3 übersetzt.

> Wenn das alles nicht hilft kann man einen anderen Algorithmus überlegen,
> da gibt's i.w. 2 Möglichkeiten.  Die Division in Assembler machen ist
> Käse da __[u]divmodXX4 bereits in Assembler steht.

s.a. Div/Add Methode.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Springer (Gast)

23.05.2017 21:48

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Was soll das?

Der "Andere" sieht seine Aufgabe vornehmlich darin, Andere zu 
unbedingten Sprüngen zu animieren, in dem er so lange stichelt, bis 
dieses Ziel erreicht ist. Ein äußerst unangenehmer Stil. Vertue Deine 
Zeit nicht damit.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jobst M. (jobstens-de)

23.05.2017 21:51

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Mach einfach - ggf. auch eine statefull -  Asm-Routine, dann baue ich
> sie in den Benchmark ein.

Geht es hier um ein Benchmark oder ein Problem?
Das Ding kannst Du 1x in C berechnen und dann 1000x das andere Teil.


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:53

Lesenswert?

•

▲
▼

Geändert:

std::percent scale_naiv(uint8_t value, uint8_t min, uint8_t max) {
    if (value < min) {
        return std::percent{0U};
    else if (value > max) {
        return std::percent{100U};
    return std::percent{(uint8_t)(((value - min) * 100U) / (max - min))};

.global scale_naiv(unsigned char, unsigned char, unsigned char)
        .type   scale_naiv(unsigned char, unsigned char, unsigned char), @function
scale_naiv(unsigned char, unsigned char, unsigned char):
/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
 ;  /home/lmeier/Projekte/wmucpp/doc/bmcpp20/bm30a.cc:86:     if (value < min) {
        cp r24,r22       ;  value, min
        brlo .L7         ; ,
        cp r20,r24       ;  max, value
        brlo .L5         ; ,
        mov r30,r22      ;  _9, min
        ldi r31,0        ;  _9
        mov r18,r24      ;  value, value
        ldi r19,0        ;  value
        sub r18,r30      ;  tmp58, _9
        sbc r19,r31      ; , _9
        ldi r21,lo8(100)         ;  tmp60,
        mul r21,r18      ;  tmp60, tmp58
        movw r24,r0      ;  tmp59
        mul r21,r19      ;  tmp60, tmp58
        add r25,r0       ;  tmp59
        clr __zero_reg__
        mov r22,r20      ;  max, max
        ldi r23,0        ;  max
        sub r22,r30      ;  tmp62, _9
        sbc r23,r31      ; , _9
        call __udivmodhi4
        mov r24,r22      ;  SR.187, tmp67
        ret
        ldi r24,lo8(100)         ;  SR.187,
/* epilogue start */
 ;  /home/lmeier/Projekte/wmucpp/doc/bmcpp20/bm30a.cc:93: }
        ret

avr-g++ V8 -O3

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 21:56

Lesenswert?

•

▲
▼

Springer schrieb:
> Wilhelm M. schrieb:
>> Was soll das?
>
> Der "Andere" sieht seine Aufgabe vornehmlich darin, Andere zu
> unbedingten Sprüngen zu animieren, in dem er so lange stichelt, bis
> dieses Ziel erreicht ist. Ein äußerst unangenehmer Stil. Vertue Deine
> Zeit nicht damit.

Dann sollte erst sich mal die MetaFunktion in FastScale (s. obiger Code) 
ansehen ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 21:58

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ok, habe die Konstanten noch auf 100U geändert. Dann wird auch call
> __udivmodhi4, was aber nichts an der messbaren Laufzeit ändert.

Ich hab mal ca. duzend Werte für max-min durchprobiert, bei allen seh 
ich ein __umulhisi3.  Wieviel der originalen Divisionen werden denn 
nicht durch mal abgebildet, und welche Werte von max-min sind das?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Uwe (Gast)

23.05.2017 22:01

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Das liegt daran, dass du signed rechnest.  Falls eine unsigned
> berechnung ok ist, dann nimm unsigned.  Da ist dann die Chance besser,
> dass der Compiler ne Division dirch Konstante als Multiplikation
> abbildet.  Dazu:
>
> 1) Als static inline schreiben, wurde ja schon genannt.  Falls das nicht
>    zu Inlining führt dann zusätzlich __attribute__((always_inline)).
>
> 2) Alle betroffenen Module mit -O2 übersetzen.
>
> Wenn das alles nicht hilft kann man einen anderen Algorithmus überlegen,
> da gibt's i.w. 2 Möglichkeiten.  Die Division in Assembler machen ist
> Käse da __[u]divmodXX4 bereits in Assembler steht.


Stellschrauben über Stellschrauben. Eine zweite, notwendige Art der 
Programmierung quasi.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 22:04

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
>  ;  /home/lmeier/Projekte/wmucpp/doc/bmcpp20/bm30a.cc:86:
> avr-g++ V8 -O3

Irgendwas machst du falsch.  Der Code ist nicht geinlinet oder du 
starrst nur auf die nicht-geinlinte, globale Instanz.  Außerdem 
übersetzt du für ein Device ohne MUL.  Ist das wirklich für einen 
Winzling ohne MUL?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 22:11

Lesenswert?

•

▲
▼

Ja, sorry. Die ge-inlined Version ist die hier (für atmega328p)

/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
        ldi r24,lo8(42)  ;  tmp47,
        sts y,r24        ;  y, tmp47
        lds r24,y        ;  y.0_1, y
        ldi r18,lo8(100)         ; ,
        mul r24,r18      ;  y.0_1,
        movw r24,r0      ;  tmp48
        clr __zero_reg__
        ldi r22,lo8(-1)  ; ,
        call __divmodhi4
 ;  ../../include/units/percent.h:36:         mValue = rhs.mValue;
        sts z,r22        ;  z.mValue, tmp56
        rjmp .L9         ; 
        .size   main, .-main

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 22:13

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ja, sorry. Die ge-inlined Version ist die hier (für atmega328p)
>         call __divmodhi4

Nö, wir waren bei unsigned :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 22:17

Lesenswert?

•

▲
▼

In der globalen Instanz ist es unsigend, in der inlined signed

       .file   "bm31a.cc"
__SP_H__ = 0x3e
__SP_L__ = 0x3d
__SREG__ = 0x3f
__tmp_reg__ = 0
__zero_reg__ = 1
 ;  GNU C++14 (GCC) version 8.0.0 20170518 (experimental) (avr)
 ;      compiled by GNU C version 8.0.0 20170515 (experimental), GMP version 6.1.2, MPFR version 3.1.5-p2, MPC version 1.0.3, isl version isl-0.15-GMP
 ;  GGC heuristics: --param ggc-min-expand=30 --param ggc-min-heapsize=4096
 ;  options passed:  -I /usr/local/avr/avr/include -I . -I ../../include
 ;  -I ../include -I ../../../include -I /usr/include/simavr
 ;  -imultilib avr5 -D__AVR_ATmega328P__ -D__AVR_DEVICE_NAME__=atmega328p
 ;  -D F_OSC=12000000 -D F_CPU=12000000
 ;  /home/lmeier/Projekte/wmucpp/doc/bmcpp20/bm31a.cc -mn-flash=1
 ;  -mmcu=avr5 -auxbase-strip bm31a.s -O2 -Wall -Wextra -std=c++1z
 ;  -fno-unwind-tables -fno-threadsafe-statics -funsigned-char
 ;  -funsigned-bitfields -fshort-enums -fconcepts -fverbose-asm -mn-flash=1
 ;  -mno-skip-bug -fno-rtti -fno-enforce-eh-specs -fno-exceptions
 ;  options enabled:  -Wmisspelled-isr -faggressive-loop-optimizations
 ;  -falign-functions -falign-jumps -falign-labels -falign-loops
 ;  -fauto-inc-dec -fbranch-count-reg -fchkp-check-incomplete-type
 ;  -fchkp-check-read -fchkp-check-write -fchkp-instrument-calls
 ;  -fchkp-narrow-bounds -fchkp-optimize -fchkp-store-bounds
 ;  -fchkp-use-static-bounds -fchkp-use-static-const-bounds
 ;  -fchkp-use-wrappers -fcode-hoisting -fcombine-stack-adjustments
 ;  -fcommon -fcompare-elim -fcprop-registers -fcrossjumping
 ;  -fcse-follow-jumps -fdefer-pop -fdevirtualize
 ;  -fdevirtualize-speculatively -fdwarf2-cfi-asm -fearly-inlining
 ;  -feliminate-unused-debug-types -fexpensive-optimizations
 ;  -fforward-propagate -ffp-int-builtin-inexact -ffunction-cse -fgcse
 ;  -fgcse-lm -fgnu-runtime -fgnu-unique -fguess-branch-probability
 ;  -fhoist-adjacent-loads -fident -fif-conversion -fif-conversion2
 ;  -findirect-inlining -finline -finline-atomics
 ;  -finline-functions-called-once -finline-small-functions -fipa-bit-cp
 ;  -fipa-cp -fipa-icf -fipa-icf-functions -fipa-icf-variables
 ;  -fipa-profile -fipa-pure-const -fipa-ra -fipa-reference -fipa-sra
 ;  -fipa-vrp -fira-hoist-pressure -fira-share-save-slots
 ;  -fira-share-spill-slots -fisolate-erroneous-paths-dereference -fivopts
 ;  -fkeep-static-consts -fleading-underscore -flifetime-dse -flra-remat
 ;  -flto-odr-type-merging -fmath-errno -fmerge-constants
 ;  -fmerge-debug-strings -fmove-loop-invariants -fomit-frame-pointer
 ;  -foptimize-sibling-calls -foptimize-strlen -fpartial-inlining
 ;  -fpeephole -fpeephole2 -fplt -fprefetch-loop-arrays -freg-struct-return
 ;  -freorder-blocks -freorder-functions -frerun-cse-after-loop
 ;  -fsched-critical-path-heuristic -fsched-dep-count-heuristic
 ;  -fsched-group-heuristic -fsched-interblock -fsched-last-insn-heuristic
 ;  -fsched-rank-heuristic -fsched-spec -fsched-spec-insn-heuristic
 ;  -fsched-stalled-insns-dep -fschedule-fusion -fsemantic-interposition
 ;  -fshow-column -fshrink-wrap -fshrink-wrap-separate -fsigned-zeros
 ;  -fsplit-ivs-in-unroller -fsplit-wide-types -fssa-backprop -fssa-phiopt
 ;  -fstdarg-opt -fstore-merging -fstrict-aliasing
 ;  -fstrict-volatile-bitfields -fsync-libcalls -fthread-jumps
 ;  -ftoplevel-reorder -ftrapping-math -ftree-bit-ccp
 ;  -ftree-builtin-call-dce -ftree-ccp -ftree-ch -ftree-coalesce-vars
 ;  -ftree-copy-prop -ftree-dce -ftree-dominator-opts -ftree-dse
 ;  -ftree-forwprop -ftree-fre -ftree-loop-if-convert -ftree-loop-im
 ;  -ftree-loop-ivcanon -ftree-loop-optimize -ftree-parallelize-loops=
 ;  -ftree-phiprop -ftree-pre -ftree-pta -ftree-reassoc -ftree-scev-cprop
 ;  -ftree-sink -ftree-slsr -ftree-sra -ftree-switch-conversion
 ;  -ftree-tail-merge -ftree-ter -ftree-vrp -funit-at-a-time -fverbose-asm
 ;  -fzero-initialized-in-bss
        .text
.global scale_naiv(unsigned char, unsigned char, unsigned char)
        .type   scale_naiv(unsigned char, unsigned char, unsigned char), @function
scale_naiv(unsigned char, unsigned char, unsigned char):
/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
        cp r24,r22       ;  value, min
        brlo .L7         ; ,
        cp r20,r24       ;  max, value
        brlo .L5         ; ,
        mov r30,r24      ; , value
        sub r30,r22      ; , min
        sbc r31,r31      ; 
        ldi r21,lo8(100)         ;  tmp60,
        mul r21,r30      ;  tmp60, tmp58
        movw r24,r0      ;  tmp59
        mul r21,r31      ;  tmp60, tmp58
        add r25,r0       ;  tmp59
        clr __zero_reg__
        sub r20,r22      ;  tmp61, min
        mov r22,r20      ;  tmp62, tmp61
        call __udivmodhi4
        mov r24,r22      ;  SR.11, tmp67
        ret
        ldi r24,lo8(100)         ;  SR.11,
/* epilogue start */
        ret
        ldi r24,0        ;  D.9136
        ret
        .size   scale_naiv(unsigned char, unsigned char, unsigned char), .-scale_naiv(unsigned char, unsigned char, unsigned char)
        .section        .text.startup,"ax",@progbits
.global main
        .type   main, @function
/* prologue: function */
/* frame size = 0 */
/* stack size = 0 */
.L__stack_usage = 0
        ldi r24,lo8(42)  ;  tmp47,
        sts y,r24        ;  y, tmp47
        lds r24,y        ;  y.0_1, y
        ldi r18,lo8(100)         ; ,
        mul r24,r18      ;  y.0_1,
        movw r24,r0      ;  tmp48
        clr __zero_reg__
        ldi r22,lo8(-1)  ; ,
        call __divmodhi4
        sts z,r22        ;  z.mValue, tmp56
        rjmp .L9         ; 
        .size   main, .-main
.global z
        .section .bss
        .type   z, @object
        .size   z, 1
        .zero   1
.global y
        .data
        .type   y, @object
        .size   y, 1
        .byte   42
        .ident  "GCC: (GNU) 8.0.0 20170518 (experimental)"
.global __do_copy_data
.global __do_clear_bss

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 22:19

Lesenswert?

•

▲
▼

Uwe schrieb:
> Johann L. schrieb:

>> 1) Als static inline schreiben, wurde ja schon genannt.  Falls das nicht
>>    zu Inlining führt dann zusätzlich __attribute__((always_inline)).
>>
>> 2) Alle betroffenen Module mit -O2 übersetzen.
>>
>> Wenn das alles nicht hilft kann man einen anderen Algorithmus überlegen,
>> da gibt's i.w. 2 Möglichkeiten.  Die Division in Assembler machen ist
>> Käse da __[u]divmodXX4 bereits in Assembler steht.
>
>
> Stellschrauben über Stellschrauben. Eine zweite, notwendige Art der
> Programmierung quasi.

Genau. Meine template-Funktion macht eigentlich alles richtig ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

23.05.2017 22:22

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> In der globalen Instanz ist es unsigend, in der inlined signed

Dann hast du noch nen Wurm drin. Code hab ich oben gezeigt:

Beitrag "Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?"

Und 255 als Divisor

>        ldi r22,lo8(-1)
>        ldi r23,0

wird deinen Code auf fast nichts eindampfen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

23.05.2017 22:30

Lesenswert?

•

▲
▼

Johann L. schrieb:
> Die Division in Assembler machen ist Käse da __[u]divmodXX4 bereits in
> Assembler steht.

Hier wird aber eine Division mit einem 16-Bit-Dividend, -Divisor und
-Ergebnis ausgeführt, obwohl eine mit 16-Bit-Dividend, 8-Bit-Divisor und
8-Bit-Ergebnis ausreichen würde. Letztere gibt es in der GCC-Lib nicht,
müsste also neugeschrieben werden, wenn man den naiven Rechenweg mit der
Division beibehalten wollte.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

23.05.2017 22:53

Lesenswert?

•

▲
▼

Auch noch die Version von Johann (s.u, scale1) eingefügt:

static inline
uint8_t scale (uint8_t value, uint8_t min, uint8_t max)
    return ((value - min) * 100u) / ((uint16_t) (uint8_t)(max - min));
uint8_t scale1 (uint8_t value)
    return scale (value, 0, 255);


ergibt dann:

O:1 naiv : 196ms
O:2 scale var : 201ms
O:3 scale d/a : 21ms
O:4 fast : 22ms
O:5 loUp Var : 38ms
O:6 loUp Fixed : 17ms
O:7 asm : 98ms
O:8 scale1 : 197ms

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von C. A. Rotwang (Gast)

24.05.2017 07:24

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:

> O:3 scale d/a   : 21ms
> O:4 fast        : 22ms
> O:5 loUp Var    : 38ms
> O:6 loUp Fixed  : 17ms
> O:7 asm         : 98ms


Naja wenn der Assembler-code langsamer ist, dann ist der C-Code 
fehlerhaft. Oder der asm sehr suboptimal. Oder Cache-Hits verfälschen 
das Ergebnis (sollte beim AVR aber nicht der Fall sein).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 07:45

Lesenswert?

•

▲
▼

Michael H. schrieb:
> Wilhelm M. schrieb:
>> Ich bin mir sicher, dass die
>> Assemblerfraktion über dieses Problemchen nur müde lächelt!
>
> Hast du mal geschaut wie unsere "Altvorderen" das gemacht haben?

Das interessiert mich ja eigentlich gar nicht! Und ich bin der Meinung, 
dass die heutigen Compilerbauer hier einen ausgezeichneten Job machen. 
Und die Ergebnisse sprechen für sich ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020180 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Uwe (Gast)

24.05.2017 09:13

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Und ich bin der Meinung,
> dass die heutigen Compilerbauer hier einen ausgezeichneten Job machen.
> Und die Ergebnisse sprechen für sich ...

Sicher. Aber wie von mir schon weiter oben angedeutet sind zur Erzielung 
der gleichen Asm-Ergebnisse viel mehr mehr sprachliche C(++)Konstrukte 
zu kennen und auch richtig einzusetzen. Die richtig zu verwendenden 
Compiler-Optionen (eine imposante Übersicht wurde ja schon geliefert) 
kommen dann noch oben drauf. Das sind alles wie zusätzlich nötige 
Programmierebenen. Dagegen kostet übersichtlicher Asm-Text herzlich 
wenig- und ist auch noch wunderbar passgenau.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 09:33

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Und ich bin der Meinung,
> dass die heutigen Compilerbauer hier einen ausgezeichneten Job machen.

Da fehlt dir offensichtlich das tiefere Verständnis für Compilerbau. 
Heute Compiler sind nicht schlecht, aber auch nicht perfekt. Man 
erinnere Linus Thorvalds der über den gcc als Oppossum-baby das auf den 
Kopf gefallen ist wetterte.
https://www.heise.de/developer/meldung/Linus-Torvalds-wettert-gegen-Compiler-Collection-GCC-4-9-2268920.html

Und egal wie gut der Compiler ist, c++ macht es den User leicht 
ineffizenten Code zu schreiben, da ist der Compiler machtlos.

Und beweisen die Test zwischen den Compilern verschiedener Hersteller 
nicht, das es die perfekten Compilerbauer nicht gibt. Mal ist der Kail 
gut, dann der IAR, ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 09:42

Lesenswert?

•

▲
▼

Uwe schrieb:
> Wilhelm M. schrieb:
>> Und ich bin der Meinung,
>> dass die heutigen Compilerbauer hier einen ausgezeichneten Job machen.
>> Und die Ergebnisse sprechen für sich ...
>
> Sicher. Aber wie von mir schon weiter oben angedeutet sind zur Erzielung
> der gleichen Asm-Ergebnisse viel mehr mehr sprachliche C(++)Konstrukte
> zu kennen und auch richtig einzusetzen.

FastScale ist nur deswegen so umfangreich, weil es generisch ist und für 
uint8_t, uint16_t, uint32_t, ... gleichermaßen arbeitet.

> Die richtig zu verwendenden
> Compiler-Optionen (eine imposante Übersicht wurde ja schon geliefert)
> kommen dann noch oben drauf. Das sind alles wie zusätzlich nötige
> Programmierebenen.

Die kommen einfach durch

-Os -fno-exceptions -fno-unwind-tables -fno-rtti -fno-threadsafe-statics

zustande.

> Dagegen kostet übersichtlicher Asm-Text herzlich
> wenig- und ist auch noch wunderbar passgenau.

Der geht allerdings auch nur mit uint8_t und ist auch noch langsamer ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter Hofbauer (Gast)

24.05.2017 09:44

Lesenswert?

•

▲
▼

Hallo Wilhelm M.

Deine Zeitangaben können nicht stimmen, wie ermittelst Du diese 
eigentlich?

Gruß Peter

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 09:45

Lesenswert?

•

▲
▼

Ordner schrieb:
> Wilhelm M. schrieb:
>> Und ich bin der Meinung,
>> dass die heutigen Compilerbauer hier einen ausgezeichneten Job machen.
>
> Da fehlt dir offensichtlich das tiefere Verständnis für Compilerbau.
> Heute Compiler sind nicht schlecht, aber auch nicht perfekt.

Habe ich nicht behauptet (eigene ASM Routinen sind aber auch nicht 
perfekt, s.o.)

>Man
> erinnere Linus Thorvalds der über den gcc als Oppossum-baby das auf den
> Kopf gefallen ist wetterte.
> 
https://www.heise.de/developer/meldung/Linus-Torvalds-wettert-gegen-Compiler-Collection-GCC-4-9-2268920.html
>
> Und egal wie gut der Compiler ist, c++ macht es den User leicht
> ineffizenten Code zu schreiben, da ist der Compiler machtlos.

Ineffizienten Code kann ich auch in Assembler schreiben.

Ich warte immer noch auf eine schnellere Assembleroutine ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 09:46

Lesenswert?

•

▲
▼

Peter Hofbauer schrieb:
> Hallo Wilhelm M.
>
> Deine Zeitangaben können nicht stimmen, wie ermittelst Du diese
> eigentlich?
>
> Gruß Peter

Schon mal in den Code geschaut ...?
Es ist immer die Zeit für 10000 Skalierungen (plus etwas Boilerplate, 
was aber immer daselbe ist).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

24.05.2017 09:51

Lesenswert?

•

▲
▼

C. A. Rotwang schrieb:
> Wilhelm M. schrieb:
>
>> O:3 scale d/a   : 21ms
>> O:4 fast        : 22ms
>> O:5 loUp Var    : 38ms
>> O:6 loUp Fixed  : 17ms
>> O:7 asm         : 98ms
>
> Naja wenn der Assembler-code langsamer ist, dann ist der C-Code
> fehlerhaft. Oder der asm sehr suboptimal.

Nein, die schnellen C-Varianten gehen davon aus, dass min und max zur
Compilezeit bekannt sind, und/oder verwenden eine Lookup-Table, um auf
die Division verzichten zu können. Siehe hier:

Wilhelm M. schrieb:
> Folgende Varianten:
>
> 1) Naiv,              uint8_t,  variabel
> 2) Naiv,              template, variabel
> 3) Division/Addieren, uint8_t,  fest
> 4) FastScale,         template, fest     (wie Division/Addieren)
> 5) Lookup,            template, variabel
> 6) Lookup,            template, fest
> 7) asm,               uint8_t,  variabel (ohne range check)

Die Assembler-Routine nimmt alle drei Argumente (min, max, und value)
als Variablen entgegen, deren Werte evtl. erst zur Laufzeit bekannt
sind. Ihre Funktionalität, Flexibilität und der Speicherverbrauch
entspricht somit der Variante aus dem Eröffungsbeitrag (Nr. 1 in den
Benchmarkergebnissen) und ist im Vergleich zu dieser immerhin um den
Faktor 2 schneller.

Natürlich kann man auch in Assembler eine Lookup-Table implementieren,
aber ich hatte Wilhelm ursprünglich so verstanden, dass er eine
"rechnende" Implementierung bevorzugt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 09:55

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ineffizienten Code kann ich auch in Assembler schreiben.

Nee, ich glaube nicht dass Du irgendwelchen lauffähigen Assemblercode 
schreiben kannst.

Und völlig ohne Ironie, man in C++ viel leichter ineffizienten Code 
schreiben als in Assembler, weil man in Assembler 1:1 sieht wie die CPU 
den Code ausführt, aber in C++ nicht.

> Ich warte immer noch auf eine schnellere Assembleroutine ...

Bist du unfähig selbst deinen C-code in Assembler übersetzen zu lassen 
und auf Schwachstellen hin zu analysieren? Und dann deinen 
C-code,Compiler-Pragmas, makefile-scripts so umzuschreiben das da 
optimaler Assembler-code rauskommt?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020297 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 09:56

Lesenswert?

•

▲
▼

Yalu X. schrieb:

> Die Assembler-Routine nimmt alle drei Argumente (min, max, und value)
> als Variablen entgegen, deren Werte evtl. erst zur Laufzeit bekannt
> sind. Ihre Funktionalität, Flexibilität und der Speicherverbrauch
> entspricht somit der Variante aus dem Eröffungsbeitrag (Nr. 1 in den
> Benchmarkergebnissen) und ist im Vergleich zu dieser immerhin um den
> Faktor 2 schneller.

Genau! Da bin ich aber froh, dass jemand sich die Mühe gemacht hat, die 
Ergebnisse zu lesen!

> Natürlich kann man auch in Assembler eine Lookup-Table implementieren,
> aber ich hatte Wilhelm ursprünglich so verstanden, dass er eine
> "rechnende" Implementierung bevorzugt.

Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten, 
erlaubt sind ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 09:59

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Die Assembler-Routine nimmt alle drei Argumente (min, max, und value)
> als Variablen entgegen, deren Werte evtl. erst zur Laufzeit bekannt
> sind. Ihre Funktionalität und Flexibilität entspricht somit der Variante
> aus dem Eröffungsbeitrag (Nr. 1 in den Benchmarkergebnissen) und ist im
> Vergleich zu dieser immerhin um den Faktor 2 schneller.

Genau das ist mit Fehlerhaften C-Code gemeint, die Umsetzung geht von 
andern Programmspezifikationen aus als die Assemblerumsetzung, sie setzt 
die Spezifikation nicht korrekt um.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 10:01

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
> erlaubt sind ;-)

Da hast aber auch geschrieben das es als C-Funktion aufrufbar sein soll. 
Das impliziert die Übergabe von Argumenten. Daran hält sich das 
Assenblerprogramm aber nicht die C-Implementierung. Das ist m.E. 
hinterfotzig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 10:02

Lesenswert?

•

▲
▼

Ordner schrieb:
> Yalu X. schrieb:
>> Die Assembler-Routine nimmt alle drei Argumente (min, max, und value)
>> als Variablen entgegen, deren Werte evtl. erst zur Laufzeit bekannt
>> sind. Ihre Funktionalität und Flexibilität entspricht somit der Variante
>> aus dem Eröffungsbeitrag (Nr. 1 in den Benchmarkergebnissen) und ist im
>> Vergleich zu dieser immerhin um den Faktor 2 schneller.
>
> Genau das ist mit Fehlerhaften C-Code gemeint, die Umsetzung geht von
> andern Programmspezifikationen aus als die Assemblerumsetzung, sie setzt
> die Spezifikation nicht korrekt um.

Blödsinn. Schau nach, welche Varianten realisiert sind ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 10:05

Lesenswert?

•

▲
▼

Ordner schrieb:
> Wilhelm M. schrieb:
>> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
>> erlaubt sind ;-)
>
> Da hast aber auch geschrieben das es als C-Funktion aufrufbar sein soll.
> Das impliziert die Übergabe von Argumenten. Daran hält sich das
> Assenblerprogramm aber nicht die C-Implementierung.

Blödsinn!

> Das ist m.E.
> hinterfotzig.

Danke!

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 10:08

Lesenswert?

•

▲
▼

Baldrian schrieb im Beitrag #5020297:
> Wilhelm M. schrieb:
>
>> Ich warte immer noch auf eine schnellere Assembleroutine ...
>
> Was gibt es zu verdienen?

Vielleicht Beschimpfungen?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Lars (Gast)

24.05.2017 10:09

Lesenswert?

•

▲
▼

Hallo Wilhelm,

kann leider als reiner Asm-Freak die Problemstellung hier nicht 
nachvollziehen. Wenn Du Deine C-Funktion nochmal in einfachen Worten 
formulieren, den konkreten Einsatzfall beschreiben und die 
Takt-Ausführungsdauer Deiner C-Funktion für genau diesen Fall nennen 
könntest?
Desweiteren ist mir nicht klar welche konkreten Anforderungen an den 
Asm-Code gestellt werden damit er aus einer C-Funktion aufrufbar ist... 
Danke.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Baldrian (Gast)

24.05.2017 10:13

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Baldrian schrieb im Beitrag #5020297:
>> Wilhelm M. schrieb:
>>
>>> Ich warte immer noch auf eine schnellere Assembleroutine ...
>>
>> Was gibt es zu verdienen?
>
> Vielleicht Beschimpfungen?

Ist von einem fordernden Selbstdarsteller - wie du es bist - maximal zu 
erwarten.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

24.05.2017 10:14

Lesenswert?

•

▲
▼

Lars schrieb:
> Wenn Du Deine C-Funktion nochmal in einfachen Worten
> formulieren, den konkreten Einsatzfall beschreiben und die

das ist doch nur eine mathematische Formel, dafür muss man C nicht 
verstehen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Der Andere (Gast)

24.05.2017 10:22

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich warte immer noch auf eine schnellere Assembleroutine ...

Unverschämter geht es kaum.
Wie ich gestern schon gesagt habe Troll, aber ihr füttert ihn fleisig 
durch.
Wenn euch Spass macht
:-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

24.05.2017 10:48

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
> erlaubt sind ;-)

Ich hätte jetzt die Annahme, dass die Funktionsargumente zur Compilezeit
bekannt sind, nicht zu den Tricks gerechnet, da sich diese Annahme ja
nicht auf die Implementierung, sondern auf die Randbedingungen bezieht.

Unter der Annahme, das sogar alle drei Argumente zur Compilezeit bekannt
sind, ist die Aufgabe trivial, da dann zur Laufzeit überhaupt nichts
mehr ausgeführt werden muss. D.h. die Rechenzeit ist 0, egal ob in C
oder in Assembler programmiert. Auch für min=0, max=100 und variablem
value muss nichts gerechnet werden.

Ich kann nicht umhin, aber irgendwie erinnert mich dieser Thread gerade
ein wenig an die C-vs-Assembler-Diskussionen mit Moby, nur andersherum.

Beispiel:

  Beitrag "Assembler wieder auf dem Weg nach vorn"

:)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 11:00

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Wilhelm M. schrieb:
>> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
>> erlaubt sind ;-)
>
> Ich hätte jetzt die Annahme, dass die Funktionsargumente zur Compilezeit
> bekannt sind, nicht zu den Tricks gerechnet, da sich diese Annahme ja
> nicht auf die Implementierung, sondern auf die Randbedingungen bezieht.

Zur Compilezeit bekannt heisst aber nicht, für jede Instanz gleich 
(bezogen auf min und max). Die Template-Lösung kann das natürlich (und 
ja auch generisch für den Input-Typ). Der fiese Trick besteht dann hier 
darin, dass natürlich für uint8_t N^2 Instanzen erzeugt werden, wenn die 
Anzahl der unterschiedlichen Paare (min, max) ist ... damit wieder der 
Speed <-> Space Trade-Off. Wie auch bei den LT Varianten.

> Unter der Annahme, das sogar alle drei Argumente zur Compilezeit bekannt
> sind, ist die Aufgabe trivial, da dann zur Laufzeit überhaupt nichts
> mehr ausgeführt werden muss. D.h. die Rechenzeit ist 0, egal ob in C
> oder in Assembler programmiert. Auch für min=0, max=100 und variablem
> value muss nichts gerechnet werden.

Gut bemerkt ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 11:21

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ordner schrieb:
>> Wilhelm M. schrieb:
>>> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
>>> erlaubt sind ;-)
>>
>> Da hast aber auch geschrieben das es als C-Funktion aufrufbar sein soll.
>> Das impliziert die Übergabe von Argumenten. Daran hält sich das
>> Assenblerprogramm aber nicht die C-Implementierung.
>
> Blödsinn!

Schau wie hättest du den die Argumentenübergabe? Werd doch endlich mal 
konkret. Dazu bist du schon gestern gefragt worden calling convention.
Weist du überhaupt was damit gemeint ist?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

24.05.2017 11:25

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Ich kann nicht umhin, aber irgendwie erinnert mich dieser Thread gerade
> ein wenig an die C-vs-Assembler-Diskussionen mit Moby, nur andersherum.

Das geht mir auch schon so die ganze Zeit. Außerdem fühle ich mich als 
Leser ein wenig verarscht. Das mag daran liegen, dass ich das 
ursprüngliche Posting so auffasste, dass hier jemand ein Problem hat, 
das er lösen muss.

Wie sich dann im Verlauf des Threads rausstellte, gehts hier aber eher 
um einen geschickt eingefädelten Programmierwettbewerb, um die 
Assembler-Programmierer (zu denen ich nicht gehöre) mal gehörig in ihre 
Schranken zu verweisen.

Ich mag solche Spielchen nicht. Wie Yalu schon bemerkte, hatten wir 
genau diese Diskussion (nur andersherum) bereits mit Moby. Und das ist 
überhaupt nicht gut ausgegangen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 11:26

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Der fiese Trick besteht dann hier
> darin, dass natürlich für uint8_t N^2 Instanzen erzeugt werden, wenn die
> Anzahl der unterschiedlichen Paare (min, max) ist ... damit wieder der
> Speed <-> Space Trade-Off. Wie auch bei den LT Varianten.

Ja mein meinst Du inline Funktion? Das kann jeder Makroassembler auch. 
Das ist auch nicht fies sondern das 1x1 der maschinennahen 
Programmierung.
Mal abgesehen das inline m.W. nicht zum urprünglichen C++ Standard 
gehört sondern eine Erweiterung ist Und mit dem eigentlichen 
Sprachkonzept nichts zu tun hat weil man es genausogut mit dem 
Präprozessor erschlagen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 11:31

Lesenswert?

•

▲
▼

Frank M. schrieb:
> Wie sich dann im Verlauf des Threads rausstellte, gehts hier aber eher
> um einen geschickt eingefädelten Programmierwettbewerb, um die
> Assembler-Programmierer (zu denen ich nicht gehöre) mal gehörig in ihre
> Schranken zu verweisen.

Sehe ich nicht so, eher im Gegenteil.

Hier wird gezeigt das man ein C-Programm nur mit Kenntniss der 
Assemblerumsetzung und gehörig Compiler-Feinsteuerung bestenfalls 
genauso schnell machen kann wie in direkter Assemblerprogrammierung.

Es werden also eher den C-programmieren ihre Grenzen aufgezeigt. Und das 
diese Grenzen erst entstehen wenn man sich weigert irgendwas von dem 
Wissen zu nutzen das auch ein Assemblerprogrammier hat. Also aus Sicht 
des TO ein Schuß ins eigene Knie. Klar, das er jetzt eingeschnappt ist. 
und Die Spielregeln zu seinen Gunsten ändert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 11:34

Lesenswert?

•

▲
▼

Ordner schrieb:
> Wilhelm M. schrieb:
>> Der fiese Trick besteht dann hier
>> darin, dass natürlich für uint8_t N^2 Instanzen erzeugt werden, wenn die
>> Anzahl der unterschiedlichen Paare (min, max) ist ... damit wieder der
>> Speed <-> Space Trade-Off. Wie auch bei den LT Varianten.
>
> Ja mein meinst Du inline Funktion?

Nein: template-Instanzen sind immer inline (müssen sie sein!). Die 
Bedeutung von inline ist nämlich ein klein wenig anders ...

> Das kann jeder Makroassembler auch.
> Das ist auch nicht fies sondern das 1x1 der maschinennahen
> Programmierung.
> Mal abgesehen das inline m.W. nicht zum urprünglichen C++ Standard
> gehört sondern eine Erweiterung ist

Blödsinn.

> Und mit dem eigentlichen
> Sprachkonzept nichts zu tun hat weil man es genausogut mit dem
> Präprozessor erschlagen.

Nein!

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 11:36

Lesenswert?

•

▲
▼

Ordner schrieb:
> Frank M. schrieb:
>> Wie sich dann im Verlauf des Threads rausstellte, gehts hier aber eher
>> um einen geschickt eingefädelten Programmierwettbewerb, um die
>> Assembler-Programmierer (zu denen ich nicht gehöre) mal gehörig in ihre
>> Schranken zu verweisen.
>
> Sehe ich nicht so, eher im Gegenteil.
>
> Hier wird gezeigt das man ein C-Programm nur mit Kenntniss der
> Assemblerumsetzung und gehörig Compiler-Feinsteuerung bestenfalls
> genauso schnell machen kann wie in direkter Assemblerprogrammierung.

Überhaupt nicht!

> Es werden also eher den C-programmieren ihre Grenzen aufgezeigt.

Da stimmt: aber es ging auch nicht um C (s.o.).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Dumdi D. (dumdidum)

24.05.2017 11:36

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> dass man das nun in
> AVR-Assembler codieren müsse.

Ja und dann? Hat dann die Firma den Assembler-experten rangesetzt? Was 
kam dabei raus? Oder muss erstmal ein Externer eingekauft werden?

Du hast doch nicht etwas die Aufgabe bekommen in einem Forum ein Lösung 
zu finden.

Also: schwache Story, Trollfaktor hoch

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 11:38

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
>> Hier wird gezeigt das man ein C-Programm nur mit Kenntniss der
>> Assemblerumsetzung und gehörig Compiler-Feinsteuerung bestenfalls
>> genauso schnell machen kann wie in direkter Assemblerprogrammierung.
>
> Überhaupt nicht!

Doch, doch.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

24.05.2017 11:38

Lesenswert?

•

▲
▼

Ordner schrieb:
> Es werden also eher den C-programmieren ihre Grenzen aufgezeigt.

Ich als C-Programmierer sehe da keine Grenzen. Ich werfe den teuren AVR 
in die Tonne und nehme einen STM32 für dasselbe Geld. Damit läuft es 
schneller, als jeder Assembler-Programmierer auf der Welt es mit einem 
AVR schafft. Das erzeugte Assembler-Listing mit schlappen 7 Zeilen Code 
für den STM32 wurde ja oben schon gezeigt. Das ist auch durch einen 
Assembler-Programmierer für den STM32 nicht mehr zu toppen.

Ich sehe da nur eine Grenze: Den AVR selbst. Aber man kann sich ja noch 
tage-, nein wochenlang mit diesem fiktiven Problem herumschlagen, wenns 
Spaß macht. Es gibt halt Leute, die wissen nichts besseres mit ihrer 
wertvollen Zeit anzufangen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020463 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 11:45

Lesenswert?

•

▲
▼

Frank M. schrieb:
>> Es werden also eher den C-programmieren ihre Grenzen aufgezeigt.
>
> Ich als C-Programmierer sehe da keine Grenzen. Ich werfe den teuren AVR
> in die Tonne und nehme einen STM32 für dasselbe Geld. Damit läuft es
> schneller, als jeder Assembler-Programmierer auf der Welt es mit einem
> AVR schafft.

Ja klar mit Birne Äpfel gewinnt man jeden Vergleich. Oder mit C auf 
32bit@50MHz versus Assembler auf 8bit@12MHz.


> Das erzeugte Assembler-Listing mit schlappen 7 Zeilen Code
> für den STM32 wurde ja oben schon gezeigt. Das ist auch durch einen
> Assembler-Programmierer für den STM32 nicht mehr zu toppen.

Genau mein Reden, mit C wird's nicht schneller als mit Assembler, das 
scheint beim TO aber noch nicht angekommen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter II (Gast)

24.05.2017 11:56

Lesenswert?

•

▲
▼

Ordner schrieb:
>> Das erzeugte Assembler-Listing mit schlappen 7 Zeilen Code
>> für den STM32 wurde ja oben schon gezeigt. Das ist auch durch einen
>> Assembler-Programmierer für den STM32 nicht mehr zu toppen.
>
> Genau mein Reden, mit C wird's nicht schneller als mit Assembler, das
> scheint beim TO aber noch nicht angekommen.

das mag bei diesen einfachen Beispiel so sein, aber warum glaubst wird 
selbst auf einem PC noch mit ASM Programmiert wenn der C code schon 
perfekt ist? Auch auf einen STM32 wird es code geben, den man mit ASM 
schneller hinbekommt, aber dann nimmst du vermutlich lieber den nächsten 
größere Prozessor.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020511 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Uwe (Gast)

24.05.2017 12:34

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich warte immer noch auf eine schnellere Assembleroutine ...

Darauf kannst Du bei Asm-only Programmierern wie mir lange warten 
solange Du den hingeworfenen Brocken hier nicht allgemeinverständlich 
erklären kannst, was dort an Takten zu unterbieten ist und wie die 
Parameterübergabe denn nun erfolgen soll.
Kryptischer C-Code samt Compileroptions-Wissenschaften kann mir 
persönlich gestohlen bleiben.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020522 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 12:43

Lesenswert?

•

▲
▼

Peter II schrieb:
> Ordner schrieb:
>>> Das erzeugte Assembler-Listing mit schlappen 7 Zeilen Code
>>> für den STM32 wurde ja oben schon gezeigt. Das ist auch durch einen
>>> Assembler-Programmierer für den STM32 nicht mehr zu toppen.
>>
>> Genau mein Reden, mit C wird's nicht schneller als mit Assembler, das
>> scheint beim TO aber noch nicht angekommen.
>
> das mag bei diesen einfachen Beispiel so sein, aber warum glaubst wird
> selbst auf einem PC noch mit ASM Programmiert wenn der C code schon
> perfekt ist? Auch auf einen STM32 wird es code geben, den man mit ASM
> schneller hinbekommt, aber dann nimmst du vermutlich lieber den nächsten
> größere Prozessor.

Mich musst Dich nicht überzeugen, das Assembler resp. 
Assemblerkenntnisse immer noch ihre Berechtigung haben. Und auch nicht 
das für Anwendungen den passenden µC und nicht eine Übermotorisierte 
Lösung um ineffiziente Programmierung und mangelnde Detailkenntnis von 
Compileroptionen, Programmierstilen und Instruction set auszugleichen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020536 wurde von einem Moderator gelöscht.

Beitrag #5020538 wurde von einem Moderator gelöscht.

Beitrag #5020539 wurde von einem Moderator gelöscht.

Beitrag #5020544 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Frank M. (ukw) (Moderator)

Benutzerseite

24.05.2017 12:52

Lesenswert?

•

▲
▼

Rudi schrieb im Beitrag #5020538:
> Das war auch auf die "klugen" Aussagen des Herrn Moderator Frank M.
> gemünzt.

Moby, Deine Posts wurden (übrigens nicht von mir) gelöscht, weil Du 
unbefristetes Hausverbot hast. Der Grund für das Hausverbot war 
Vandalismus, weil Du mehrere Wiki-Artikel hier einfach gelöscht bzw. mit 
Unsinn überschrieben hast. Dein ganzes Verhalten hinterlässt bei den 
Lesern hier lediglich den Eindruck enormer krimineller Energie. Das ist 
bestimmt nicht das, was Du mit solchen Aktionen bezweckst.

Deine Posts können noch so sinnvoll sein, gelöscht werden sie trotzdem. 
Deine wiederholten Beiträge, die Du hier auf mich münzt, obwohl ich 
persönlich bis dato hier überhaupt nichts gelöscht habe, zeugt nur von 
Deiner Blindheit, wie Du hier vorgehst und bekräftigt uns Moderatoren 
lediglich in der Ansicht, das Hausverbot auch konsequent durchzusetzen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020546 wurde von einem Moderator gelöscht.

Beitrag #5020552 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 12:59

Lesenswert?

•

▲
▼

Uwe schrieb:
> Kryptischer C-Code samt Compileroptions-Wissenschaften kann mir
> persönlich gestohlen bleiben.

Ist aber interessant. Diese inline-Geschichten hab ich mir beim avr-gcc 
auch mal angeschaut. Funktioniert am Anfang ganz gut, aber dann macht es 
der Compiler einfach nicht mehr. Er schmiss auch trotz -Wall keine 
Meldung, weil es als Info-Ausgegeben wurde. Da stand so etwa: Ich mach 
kein inline hier weil das mit der globalen Optimierung kollidiert. Also 
muss da vor dem inline ein pragma rein das die Optimierung für diesen 
abschnitt ausschaltet, damit er sich den Funktionsauruf mit temporären 
Sichern der Register spart.

Dann ist man wieder geneigt statt inline die verpönten 
Präprozessor-Makros zu nehmen. Und damit kommt man wieder auf das Niveau 
das man schon von der Assemblerprogrammierung kennt:

Selber eine Vortstellung zu haben welche Möglichkeiten es bei der 
Umsetzung gibt und sicherstellen das auch die vom User akzeptierte 
Variante verwendet wird.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020561 wurde von einem Moderator gelöscht.

Beitrag #5020573 wurde von einem Moderator gelöscht.

Beitrag #5020588 wurde von einem Moderator gelöscht.

Beitrag #5020589 wurde von einem Moderator gelöscht.

Beitrag #5020591 wurde von einem Moderator gelöscht.

Beitrag #5020595 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

24.05.2017 13:50

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Auch noch die Version von Johann (s.u, scale1) eingefügt:
>
>

> static inline
> uint8_t scale (uint8_t value, uint8_t min, uint8_t max)
>     return ((value - min) * 100u) / ((uint16_t) (uint8_t)(max - min));
> uint8_t scale1 (uint8_t value)
>     return scale (value, 0, 255);

>
> ergibt dann:
>
> O:1 naiv : 196ms
> ...
> O:8 scale1 : 197ms

Das du übersetzbaren Code dazu?  Offenbar wird da immer noch dividiert.

Bitte reduzieren Sie die Anzahl der Zitatzeilen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020598 wurde von einem Moderator gelöscht.

Beitrag #5020612 wurde von einem Moderator gelöscht.

Beitrag #5020638 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jörg W. (dl8dtl) (Moderator)

Benutzerseite

24.05.2017 14:37

Lesenswert?

•

▲
▼

Ordner schrieb:
> Diese inline-Geschichten hab ich mir beim avr-gcc auch mal angeschaut.
> Funktioniert am Anfang ganz gut, aber dann macht es der Compiler einfach
> nicht mehr.

Die Dinger funktionieren durchaus, aber das primäre Publikum dafür sind 
eher nicht Endanwender, sondern Implementierer von Systembibliotheken 
und dergleichen.  Das Ziel des Inline-Assemblers ist eine möglichst 
optimale Integration in das Compilat, ohne den Compiler unnütz in seinen 
Freiheiten bezüglich der Optimierung einschränken zu müssen.   Damit 
dieses Ziel erreicht wird, sollte man nicht gerade schreibfaul sein, 
sondern wirklich alles als formale Parameter in das inline asm statement 
reingeben, was man darin benötigt (einschließlich Hilfsregistern etc.).

Für eine Aufgabe wie hier ist sowas nicht sinnvoll geeignet.  Da kann 
man dann auch direkten Assemblercode dazu linken.

Aber dass dieser ganze Wettbewerb hier eher von zweifelhaftem Nährwert 
ist, wurde ja bereits konstatiert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 15:06

Angehängte Dateien:

bm30b.cc (9,67 KB)
bm30b.s (5,81 KB)

Lesenswert?

•

▲
▼

Johann L. schrieb:
>>
>> O:1 naiv : 196ms
>> ...
>> O:8 scale1 : 197ms
>
> Das du übersetzbaren Code dazu?  Offenbar wird da immer noch dividiert.

Ich habe aus dem Testcode alle Zeilen auskommentiert, die Du nicht ohne 
weiteres übersetzen kannst. Sollte also auch bei Dir compilierbar sein. 
Anbei auch der generierte asm-Code. Es ist also nur noch Deine Version 
drin.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Wilhelm M. (wimalopaan)

24.05.2017 15:15

Lesenswert?

•

▲
▼

Jörg W. schrieb:

> Für eine Aufgabe wie hier ist sowas nicht sinnvoll geeignet.  Da kann
> man dann auch direkten Assemblercode dazu linken.

Wurde ja auch schon gemacht: s.o. Code von Yalu

> Aber dass dieser ganze Wettbewerb hier eher von zweifelhaftem Nährwert
> ist, wurde ja bereits konstatiert.

Wenn dem so wäre, hätte ich erwartet, dass einfach eine klare Antwort 
kommt. Diese Diskussion hier zeigt jedoch etwas anderes.

Im übrigen bin ich mit einem modifizierten div/add Algorithmus als 
template ganz zufrieden. Da bzgl. der Skalierung nicht allzu viele 
unterschiedliche instanziiert werden, ist der Code-Overhead nicht so 
schlimm. Wichtiger ist die reduzierte Laufzeit (spave vs time). Zudem 
fasst der Compiler auch noch unterschiedliche Instanziierungen zusammen.

Danke für die (eine) Realisierung in Assembler an Yalu!!!  Und die 
freundlichen Worte einiger anderer ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

24.05.2017 15:45

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Johann L. schrieb:
>>>
>>> O:1 naiv : 196ms
>>> ...
>>> O:8 scale1 : 197ms
>>
>> Das du übersetzbaren Code dazu?  Offenbar wird da immer noch dividiert.
>
> Ich habe aus dem Testcode alle Zeilen auskommentiert, die Du nicht ohne
> weiteres übersetzen kannst. Sollte also auch bei Dir compilierbar sein.

Ja.  Irgendein Unterschied zwischen <= v6 und >= v7.  Die alte(n) 
Version(en) machen keine Division, die neue(n) aber schon.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 16:02

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Ordner schrieb:
>> Diese inline-Geschichten hab ich mir beim avr-gcc auch mal angeschaut.
>> Funktioniert am Anfang ganz gut, aber dann macht es der Compiler einfach
>> nicht mehr.
>
> Die Dinger funktionieren durchaus, aber das primäre Publikum dafür sind
> eher nicht Endanwender, sondern Implementierer von Systembibliotheken
> und dergleichen.  Das Ziel des Inline-Assemblers ist eine möglichst
> optimale Integration in das Compilat, ohne den Compiler unnütz in seinen
> Freiheiten bezüglich der Optimierung einschränken zu müssen.   Damit
> dieses Ziel erreicht wird, sollte man nicht gerade schreibfaul sein,
> sondern wirklich alles als formale Parameter in das inline asm statement
> reingeben, was man darin benötigt (einschließlich Hilfsregistern etc.).

Ich hab mich unpräzise ausgedrückt, ich meine nicht den "inline 
Assembler" sondern das Codewort "inline" vor einer (C/C++-)function, um 
zu verhindern das das zu einem subprogromm call mit Parameterübergabe 
übersetzt wird. Im konkreten fall wohl sogar auch komplett ohne 
variablen , respektive nur mit konstanten Parametern. Das ist auch genau 
der TO-Fall der hier benutzt wird um die "naive" Implementierung zu 
optimieren. Er nennt das nicht inline obwohl er das Codewort inline 
benutzt, sondern "template".

Diese function-inline sehe ich als tool für die systemprogrammierer 
allein, wie du es für den "inline-Assembler" darstellst. Nach meiner 
Erfahrung funktioniert diese iunline-function auch für den fall ohne 
Parameter unzuverlässig, es wird gelöegentlich trotz des codeworts 
inline als CALL/RETURN umgesetzt und nicht Makroexpansion an Ort und 
Stelle. Auch wenn keine Parameter übergeben und das ganze PUSH/POP etc. 
entfällt ist ein CALL/Return wie jeder Sprung langsamer (2 cycles per 
CALL/RET).

In meiner Anwendung war diesen verloren 2 cycle wirklich essential, da 
ich eine schnelle SPI Verbindung über zwei Kanäle gleichzeitig abwickeln 
musste, aber nur ein SPI-Module im AVR ist. Deshalb war ich auch 
ziemlich frustiert das inline-function bei avr-gcc nur mit tricks sicher 
so umgesetzt wird wie ich es brauchte.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Yalu X. (yalu) (Moderator)

24.05.2017 16:02

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Johann L. schrieb:
>>>
>>> O:1 naiv : 196ms
>>> ...
>>> O:8 scale1 : 197ms
>>
>> Das du übersetzbaren Code dazu?  Offenbar wird da immer noch dividiert.
>
> Ich habe aus dem Testcode alle Zeilen auskommentiert, die Du nicht ohne
> weiteres übersetzen kannst.

In deinem Assemblerlisting lese ich etwas von -Os (die anderen Optionen
habe ich mir nicht angeschaut). Die Umwandlung einer Konstantendivision
in eine Konstantenmultiplikation mit Shiften des Ergebnisses geschieht
nicht bei -Os, weil diese Umwandlung den Programmcode zwar schneller,
aber auch etwas größer macht. Hast du mal -O2 probiert?

Wilhelm M. schrieb:
> Im übrigen bin ich mit einem modifizierten div/add Algorithmus als
> template ganz zufrieden.

Meinst du diesen hier?

constexpr percent scale(uint8_t value) {
    return std::percent{(uint8_t)((uint8_t)(value / 4) + (uint8_t)(value / 8) + (uint8_t)(value / 64))};


Der ist zwar sauschnell, liefert aber i.Allg. ungenauere Ergebnisse als
der Originalcode mit min=0 und max=255 und macht zudem größere Sprünge
zwischen aufeinanderfolgenden Werten für value.

Beispiele:

  value   Original   Div/Add
  ——————————————————————————
   127       49        47 \___ großer Sprung
  ——————————————————————————

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 16:05

Lesenswert?

•

▲
▼

Ordner schrieb:
> Diese function-inline sehe ich als tool für die systemprogrammierer
> allein, wie du es für den "inline-Assembler" darstellst.

Aargh, typo. ;-(  Es soll heissen

Diese function-inline sehe ich NICHT als tool für die 
Systemprogrammierer
allein, wie du es für den "inline-Assembler" darstellst sondern als 
legitimen Ersatz für die verpönten Präprocessor-Makros.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jörg W. (dl8dtl) (Moderator)

Benutzerseite

24.05.2017 16:06

Lesenswert?

•

▲
▼

Ordner schrieb:
> Ich hab mich unpräzise ausgedrückt, ich meine nicht den "inline
> Assembler" sondern das Codewort "inline" vor einer (C/C++-)function, um
> zu verhindern das das zu einem subprogromm call mit Parameterübergabe
> übersetzt wird.

Dafür ist das Schlüsselwort gar nicht gedacht.  Es ist lediglich ein
Hinweis an den Compiler, diese Funktion fürs Inlining möglichst in
Betracht zu ziehen.  Eine Verpflichtung entsteht ihm daraus nicht.

Der GCC kennt allerdings ein Funktionsattribut (“always_inline”), bei
dem das Inlining erzwungen wird.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 16:14

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Dafür ist das Schlüsselwort gar nicht gedacht.  Es ist lediglich ein
> Hinweis an den Compiler, diese Funktion fürs Inlining möglichst in
> Betracht zu ziehen.  Eine Verpflichtung entsteht ihm daraus nicht.

Ah, das ist mir neu; aber nicht unerwartet, der C-Compiler macht eben 
das was gut für ihn ist und nicht unbedingt das was der User verlangt. 
Das erklärt auch, warum das nur als Info und nicht als Warning 
ausgegeben wurde. Was ich aber als Fehler betrachtete; wenn etwas nicht 
so umgesetzt wurde wie verlangt, dann wäre das schon eine Warning wie 
"Code has no effect" wert.

> Der GCC kennt allerdings ein Funktionsattribut (“always_inline”), bei
> dem das Inlining erzwungen wird.

Mal schauen ob der gcc-avr das auch hat. Sollte der TO auch in seinem 
Code verwenden, nicht das sein geschwindigkeitsvorteil nach Compiler 
Gutdünken in nichts auflöst.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 16:23

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Im übrigen bin ich mit einem modifizierten div/add Algorithmus als
> template ganz zufrieden.

 Den hättest du auch ohne deine Seitenhiebe ins Assemblerlager und 
"benchmarktuning" erhalten

>  Und die
> freundlichen Worte einiger anderer ...

Es wären mehr wenn du dir die Seitenhiebe und den trollhaften Ton 
gespart hättest. Du weist ja, "Wie man in den Wald hinruft, so tönt es 
heraus".

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Johann L. (gjlayde)

Benutzerseite

24.05.2017 16:24

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Hast du mal -O2 probiert?

Ist wie gesagt ein Problem mit -O2 ab v7.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jörg W. (dl8dtl) (Moderator)

Benutzerseite

24.05.2017 16:30

Lesenswert?

•

▲
▼

Ordner schrieb:

> Ah, das ist mir neu; aber nicht unerwartet, der C-Compiler macht eben
> das was gut für ihn ist und nicht unbedingt das was der User verlangt.

Es steht einfach so im Standard.

A function declared with an inline function specifier is an inline function. The
function specifier may appear more than once; the behavior is the same as if it appeared
only once. Making a function an inline function suggests that calls to the function be as
fast as possible. The extent to which such suggestions are effective is
implementation-defined. 124)


Fußnote 124 ist:

“For example, an implementation might never perform inline substitution, 
or might only perform inline substitutions to calls in the scope of an 
inline declaration.”

Letzteres ist nahezu unabdingbar, denn sonst müsste der Compiler ja
außer den Headerfiles (scope of declaration) auch noch alternative 
Implementierungsfiles komplett analysieren.

Ersteres suggeriert, dass es eben ein Compiler auch komplett ignorieren 
darf.

GCC geht einen Mittelweg, bei dem er die Komplexität des davon 
generierten Codes relativ zu den aktuellen Optimierungseinstellungen 
bewertet.  Mit -O3 beispielsweise bekommst du auch Funktionen inline 
erweitert, für die es gar nicht verlangt worden ist, mit -O1/-Os 
passiert sowas nur dann, wenn eine "static"-Funktion lediglich ein 
einziges Mal benutzt wird.

> Was ich aber als Fehler betrachtete;

Was du als Fehler betrachtest, unterscheidet sich halt davon, was der 
Standard als Fehler betrachtet; nur letzteres darf ein Compiler jedoch 
als Fehler generieren.  Bezüglich Warnungen hingegen ist der Compiler 
freier in seinen Entscheidungen.

>> Der GCC kennt allerdings ein Funktionsattribut (“always_inline”), bei
>> dem das Inlining erzwungen wird.
>
> Mal schauen ob der gcc-avr das auch hat.

Der AVR-GCC ist ein GCC.  Das Frontend ist grundsätzlich erstmal 
zwischen den einzelnen Zielplattformen gleich.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Ordner (Gast)

24.05.2017 16:53

Lesenswert?

•

▲
▼

Jörg W. schrieb:
>> Was ich aber als Fehler betrachtete;
>
> Was du als Fehler betrachtest, unterscheidet sich halt davon, was der
> Standard als Fehler betrachtet; nur letzteres darf ein Compiler jedoch
> als Fehler generieren.  Bezüglich Warnungen hingegen ist der Compiler
> freier in seinen Entscheidungen.

ich hab mich unpräzise ausgedrückt, ich meine nicht, der Compiler hätte 
das als " Error" melden sollen. sondern er hätte das als "Warning" 
ausgeben sollen, was er aber trotz -Wall nicht tat. sondern nur als 
"Info". Das ist natürlich blöd wenn man das Compiler-log auf warning 
grept und garnicht anschaut wenn warnings: 0 ausgegeben wird. Also der 
Standard hat hier meines Erachtens einen Error, das Ignorieren des 
Keywords inline hätte als Warning ins log gehört.

> Letzteres ist nahezu unabdingbar, denn sonst müsste der Compiler ja
> außer den Headerfiles (scope of declaration) auch noch alternative
> Implementierungsfiles komplett analysieren.

Möglicherweise hat mir das dem inline das Genick gebrochen, ich meine 
ich habe die Funktionen mit dem inline als .c ausgelagert. Und da das 
nicht wollte wieder main() und die meisten files bis auf die eigenen 
Prototypen in ein file gepackt. Dann tat das inline wieder. Das hat mich 
auch bei C++ gestört, das es unter Umständen abhängig ist wie man seinen 
Code auf verschiedene files aufteilt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020792 wurde von einem Moderator gelöscht.

Beitrag #5020798 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jörg W. (dl8dtl) (Moderator)

Benutzerseite

24.05.2017 17:26

Lesenswert?

•

▲
▼

Ordner schrieb:

> ich hab mich unpräzise ausgedrückt, ich meine nicht, der Compiler hätte
> das als " Error" melden sollen. sondern er hätte das als "Warning"
> ausgeben sollen, was er aber trotz -Wall nicht tat.

Entgegen dem, was der Optionsname suggeriert, umfasst “-Wall” keineswegs
alle Warnungen, sondern nur die, die am häufigsten interessant
sind.  Zusätzlich sollte man sich ohnehin angewöhnen, auch gleich
noch “-Wextra” mit anzugeben.

Hätte allerdings hier auch nicht geholfen, denn die von dir
gewünschte Warnung wird mit “-Winline” eingeschaltet, welches auch
bei “-Wextra” nicht mit dabei ist.

> sondern nur als
> "Info".

Du sprichst in Rätseln: ich kenne nur Warnungen oder Fehler, aber
wüsste nicht, was eine „Info“ des Compilers sein soll.

>> Letzteres ist nahezu unabdingbar, denn sonst müsste der Compiler ja
>> außer den Headerfiles (scope of declaration) auch noch alternative
>> Implementierungsfiles komplett analysieren.
>
> Möglicherweise hat mir das dem inline das Genick gebrochen, ich meine
> ich habe die Funktionen mit dem inline als .c ausgelagert.

Wenn du mal ein bisschen nachdenkst, wie ein Compiler arbeitet, dann
sollte ganz schnell offensichtlich werden, dass etwas, was er inline
erweitern soll, ihm auch an der Stelle, wo es benötigt wird, bereits
bekannt sein muss.  Dafür kann man es eigentlich nur in einer
Headerdatei angeben … gewöhn' dir dann aber bitte gleich noch an, nicht
nur “inline” zu schreiben, sondern “static inline”, denn das Verhalten
von “extern inline” (was es ohne “static” wäre) ist seit C99, ähem,
nicht sonderlich intuitiv spezifiziert, um's mal vorsichtig zu
formulieren.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020835 wurde von einem Moderator gelöscht.

Beitrag #5020839 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von A. S. (Gast)

24.05.2017 18:15

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> dann baue ich sie in den Benchmark ein.

hast Du denn schon die uint16_t Versionen getestet?

uint8_t scale(uint16_t value, uint16_t min, uint16_t delta) {
    return ((value - min) * 100) / (delta);
}

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5020852 wurde von einem Moderator gelöscht.

Beitrag #5020885 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Patrick J. (ho-bit-hun-ter)

24.05.2017 20:14

Lesenswert?

•

▲
▼

Hi

Habe den Thread jetzt nur überflogen ...

Warum wurde das C-Konstrukt bisher noch nicht als ASM-Listing händisch 
optimiert?
Wenn Der Compiler doch mit allen (noch so fiesen Tricks) die 
Geschwindigkeit erhöhen darf, kann man doch auch diese ASM-Version 
'Korrektur-Lesen'.

Fiel mir in den ganzen Posts nicht auf, daß Das schon gemacht wurde - 
vorgeschlagen JA, aber dann auch nur wieder ignoriert.

Selber spiele ich in Assembler, was den großen 'Vorteil' der 
Hardware-Nähe mitbringt ... ein anderes Steinchen und das Listing ist 
(mindestens nahezu) unbrauchbar.
Bei C/C++ sehe ich dem Vorteil, daß das Programm auf den Chip passend 
'zusammen gespaxt' wird - was, meinem Verständnis nach, nicht immer zu 
100%igem Code führen kann.
Warum aber nicht hier anfassen, wo der Compiler aufgehört hat?

Habe selber aber mit C/C++ nicht wirklich was am Hut, weshalb meine 
Sicht der Dinge durchaus arg subjektiv sein mag.

MfG

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Dieter F. (Gast)

24.05.2017 20:48

Lesenswert?

•

▲
▼

Patrick J. schrieb:
> Warum wurde das C-Konstrukt bisher noch nicht als ASM-Listing händisch
> optimiert?

Weil Du Dich bisher nicht eingemischt hast?

Mach mal ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Patrick J. (ho-bit-hun-ter)

24.05.2017 21:03

Lesenswert?

•

▲
▼

Hi

Dann Mal her mit dem Listing ... da, so wie ich schrieb, ich selber NIX 
mit C 'am Hut' habe, ist das Compilieren und den ASM-Code selber 
erstellen - nicht drin.
Wäre halt schön, daß dann der ultimativ schnellste, beste und so_oder_so 
tollste Code, Der in C schon rennt 'wie Lumpi', kompiliert werden 
sollte.

Aus einem Fiat 500 wird halt nur schwer ein echter Ferrari, wenn auch 
die Schmiede identisch ist ;)

Noch mische ich also mit :)

MfG

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5021029 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Jobst M. (jobstens-de)

24.05.2017 21:12

Lesenswert?

•

▲
▼

Wilhelm M. schrieb:
> Ich warte immer noch auf eine schnellere Assembleroutine ...

Wilhelm M. schrieb:
> Jein, ich hatte eigentlich gesagt, dass alle Tricks, auch die fiesesten,
> erlaubt sind ;-)

Naja, meine pfiffige Lösung, welche mit 7 Takten zufrieden ist, möchtest 
Du ja nicht testen. Nein, ich werde mir für Dich nicht aneignen, wie man 
das in C hinein bekommt.
Außerdem bist Du nicht auf meine Frage nach der Bedingung eingegangen:

Jobst M. schrieb:
> Also wie oft sich Dein max und min verändert.

Sollte es jetzt notwendig sein, das JEDES Mal neu zu berechnen, dann 
muss dafür eben auch etwas pfiffiges gefunden werden. Sollte auch in 
unter 100 Takten (8,3µs@12MHz µs, nicht ms!) zu erledigen sein. Aber 
nicht mehr von mir ...


Frank M. schrieb:
> Das geht mir auch schon so die ganze Zeit. Außerdem fühle ich mich als
> Leser ein wenig verarscht.

Frank M. schrieb:
> Wie sich dann im Verlauf des Threads rausstellte, gehts hier aber eher
> um einen geschickt eingefädelten Programmierwettbewerb, um die
> Assembler-Programmierer (zu denen ich nicht gehöre) mal gehörig in ihre
> Schranken zu verweisen.

Den Eindruck habe ich mittlerweile auch, da die fiesen Tricks erstmal 
von ihm ignoriert werden.


Ordner schrieb:
> Ja klar mit Birne Äpfel gewinnt man jeden Vergleich. Oder mit C auf
> 32bit@50MHz versus Assembler auf 8bit@12MHz.

Dann nimm eben einen 8051. Der kann teilen. 4 Takte. 8Bit/8Bit.
Bei dem berechne ich 64 Bit Orthodrome in ASM schneller, als der TO 
teilt ...

BTW: ist die DIV/8 Fuse eigentlich gesetzt? ...


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5021299 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Mark B. (markbrandis)

25.05.2017 11:45

Lesenswert?

•

▲
▼

Ich persönlich glaube ja, dass der Themenersteller uns hier was vom 
Pferd erzählt.

In einer normalen Firma verlangt kein Projektleiter und kein 
Vorgesetzter die Umsetzung eines bestimmten Algorithmus in Assembler. 
Was gefordert wird, ist die Erfüllung der Anforderungen. Punkt.

Abgesehen davon wurde das Problem bzw. dessen Randbedingungen nicht 
richtig beschrieben. Dazu gehört zum Beispiel eine Angabe, wieviel 
(Rechen-)Zeit die Ausführung des Algorithmus denn benötigen darf.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Peter D. (peda)

25.05.2017 12:18

Lesenswert?

•

▲
▼

Mark B. schrieb:
> Ich persönlich glaube ja, dass der Themenersteller uns hier was vom
> Pferd erzählt.

Sehe ich auch so.
Bevor ich irgendwas optimiere, muß ich wissen, ob das überhaupt der 
Flaschenhals ist.
In diesem Fall ist aber der Kontext völlig unklar, warum das ein 
Flaschenhals sein soll.

Und sobald man den Kontext kennt, kann man oft den Programmablauf so 
umstellen, daß sich der Flaschenhals ganz von selbst auflöst ohne 
jedwede Optimierung oder gar Assembler.

Es wird nur unnütz Entwicklungszeit verplempert, wenn man an der völlig 
falschen Stelle ansetzt, weil entscheidende Informationen vorenthalten 
werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5021647 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Dumdi D. (dumdidum)

25.05.2017 14:05

Lesenswert?

•

▲
▼

Vor allem wäre da noch die Frage welchr Garantien die Funktion verwenden 
darf. Ist z.B min immer <= zahl? Darf der Assemblercode von dem 
C-Fragment abweichendes Verhalten haben falls das nicht der Fall ist?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5021665 wurde von einem Moderator gelöscht.

Beitrag #5021670 wurde von einem Moderator gelöscht.

Re: Assembler (AVR) Freaks bitte: der schnellste Weg, einen ganzzahligen Wert zu skalieren?

von Dr. Google (Gast)

25.05.2017 14:47

Lesenswert?

•

▲
▼

Ich hatte mal den Fall auf einem 386SX.
Damals hatte es sich gelohnt "den 4-Byte float" in einen Bruch zu 
verwandeln, also 2 8-Bit Zahlen daraus zu machen.

Diese Rationalzahl konnte schneller über Addition und Subtraktion 
verarbeitet werden.

Für AVR lohnt sich das nicht recht, weil der schnell multiplizieren 
kann. Die Division macht man dann über Schiebebefehl.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5021740 wurde von einem Moderator gelöscht.

Beitrag #5021798 wurde von einem Moderator gelöscht.

Beitrag #5022044 wurde von einem Moderator gelöscht.

Beitrag #5022051 wurde von einem Moderator gelöscht.

Beitrag #5022066 wurde von einem Moderator gelöscht.

Thread beobachten |

Seitenaufteilung abschalten

Dieser Beitrag ist gesperrt und kann nicht beantwortet werden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net