-Os liefert schlechtes Ergebnis

von Ingo L. (corrtexx)

21.06.2023 10:41

Lesenswert?

•

Hallo Forum,

ich habe folgenden Code auf einem Atmega328 @1MHz am Laufen:

void Multiplex ( unsigned int Zeit )
  static unsigned char DigitCount = 0;
  uint8_t Sekunden, Minuten;
  // Update MUX
  DigitCount++;
  DigitCount &= 3;
  // Clear all Digits
  PORTB &= ~( ( 1<<PORTB6 ) | ( 1<<PORTB0 ) | ( 1<<PORTB1 ) | ( 1<<PORTB2 ) );
  // Clear Databus
  PORTD = 0;
  if ( Zeit >= 6000 ){ // mm:ss  
    // Update Digits
    Minuten = Zeit / 6000;
    Sekunden = (Zeit/100) % 60;
    switch ( DigitCount ){
      case 0:{
        PORTD = Ziffer[Sekunden%10];
        PORTB |= ( 1<<PORTB6 );
        break;
      case 1:{
        PORTD = Ziffer[Sekunden/10];
        if ((Sekunden % 10 ) % 2 )    PORTD |= SEG_DP;
        else              PORTD &= ~SEG_DP;
        PORTB |= ( 1<<PORTB0 );
        break;
      case 2:{
        PORTD = Ziffer[Minuten%10];
        if ((Sekunden % 10 ) % 2 )    PORTD |= SEG_DP;
        else              PORTD &= ~SEG_DP;
        PORTB |= ( 1<<PORTB1 );
        break;
      case 3:{
      //  PORTD = Ziffer[Minuten/10];
      //  PORTB |= ( 1<<PORTB2 );
        break;
    if (!Clock.State)  PORTD |= SEG_DP;


Die Funktion wird mit 1kHz aufgerufen.
Dabei passiert es, dass im Falle Zeit >= 6000 im case 2 das Digit nur 
ein sehr kurzen Moment angeschaltet wird (210µs statt wie bei den 
Anderen 490µs), da offensichtlich für etwas vorauslaufendes sehr viel 
Zeit benötigt wird. Ändert man die Optimierung vo -Os auf -O1 oder -O2, 
ist die Einschaltzeit >950µs, bei allen Digits gleich.

Tauscht man bei -Os die Zeile 38 gegen 24 wandert die lange 
Bearbeitungszeit zu dem anderen Digit. Offensichtlich stört sich der 
Compiler erheblich an

PORTD = Ziffer[Minuten%10];


Mit -Os:
        Program Memory Usage   :  1784 bytes   5,4 % Full
        Data Memory Usage     :  49 bytes   2,4 % Full

        PORTD = Ziffer[Minuten%10];
 12a:  2a e0         ldi  r18, 0x0A  ; 10
 12c:  62 2f         mov  r22, r18
 12e:  0e 94 36 03   call  0x66c  ; 0x66c <__udivmodqi4>
 132:  e9 2f         mov  r30, r25
 134:  f0 e0         ldi  r31, 0x00  ; 0
 136:  ef 5f         subi  r30, 0xFF  ; 255
 138:  fe 4f         sbci  r31, 0xFE  ; 254
 13a:  80 81         ld  r24, Z
 13c:  8b b9         out  0x0b, r24  ; 11


Mit -O1:
        Program Memory Usage   :  1992 bytes   6,1 % Full
        Data Memory Usage     :  41 bytes   2,0 % Full

          PORTD = Ziffer[Minuten%10];
 2aa:  8d ec         ldi  r24, 0xCD  ; 205
 2ac:  e8 9f         mul  r30, r24
 2ae:  81 2d         mov  r24, r1
 2b0:  11 24         eor  r1, r1
 2b8:  98 2f         mov  r25, r24
 2ba:  99 0f         add  r25, r25
 2bc:  99 0f         add  r25, r25
 2be:  89 0f         add  r24, r25
 2c0:  88 0f         add  r24, r24
 2c2:  9e 2f         mov  r25, r30
 2c4:  98 1b         sub  r25, r24
 2c6:  89 2f         mov  r24, r25
 2c8:  e9 2f         mov  r30, r25
 2ca:  f0 e0         ldi  r31, 0x00  ; 0
 2cc:  ef 5f         subi  r30, 0xFF  ; 255
 2ce:  fe 4f         sbci  r31, 0xFE  ; 254
 2d0:  90 81         ld  r25, Z
 2d2:  9b b9         out  0x0b, r25  ; 11


Der hier speichersparende Aufruf von __udivmodqi4> führt offensichrlich 
zu einer erheblichen Verlangsamung gegenüber der direkten Berechnung 
ohne Funktionsaufruf. Das Verhalten zeigte sich mit dem AVR GCC 7.4. und 
9.2 identisch. Dieses Beispiel soll zeigen, dass die Optimierung 
durchaus nennenswert dazwischen grätschen kann. Evtl. hilft das ja 
irgendwem irgendwann einmal weiter ;)

P.S.:
Die Abfrage

if ( Zeit >= 6000 ){ // mm:ss

ist notwendig, weil es noch andere Behandlungen von Zeit gibt, bei der 
die Problematik jedoch nicht auftaucht, nur falls jemand fragt...

Beitrag melden Bearbeiten Thread verschieben Thread entsperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Peter D. (peda)

21.06.2023 10:51

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Die Funktion wird mit 1kHz aufgerufen.

Da kein Mensch 1000 Werte je Sekunde ablesen kann, nimmt man einfach die 
ganzen Berechnungen aus dem kritischen Teil raus und führt sie nur 
einmalig je neuem Wert aus. Ergonomisch ist eine Anzeigerate von 2..5Hz.

Besonders die Divisionen sind teuer, da der AVR keinen Befehl dafür hat.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Harald K. (kirnbichler)

21.06.2023 10:51

Lesenswert?

•

▲
▼

-Os bedeutet "optimize size". Vielleicht ist das nicht die beste Option 
für Deinen Anwendungsfall.

http://gcc.gnu.org/onlinedocs/gcc/Optimize-Options.html

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Wilhelm M. (wimalopaan)

21.06.2023 10:54

Lesenswert?

•

▲
▼

Der 328 kann 20MHz.

Statt die Zeit in einem Zähler zu verwalten,nimm gleich die zerbrochene 
Darstellung in sec, min,Std,... . Dann vermeidest du divmod .

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Dergute W. (derguteweka)

21.06.2023 10:55

Lesenswert?

•

▲
▼

Moin,

Ingo L. schrieb:
> Dieses Beispiel soll zeigen, dass die Optimierung
> durchaus nennenswert dazwischen grätschen kann.

Was heisst dazwischengraetschen? Du sagst dem Compiler, er soll auf 
Groesse optimieren und dann moserst du rum, dass er nicht auf 
Geschwindigkeit optimiert?
Da kann der Compiler nix dazu, finde ich. Der macht genau das, was du 
ihm sagst. Und nicht das, was du vielleicht meinst.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Wastl (hartundweichware)

21.06.2023 10:57

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Der hier speichersparende Aufruf von __udivmodqi4> führt offensichrlich
> zu einer erheblichen Verlangsamung gegenüber der direkten Berechnung
> ohne Funktionsaufruf.

Da trägst du Eulen nach Athen. Ist eigentlich bekannt.

Funktionsaufrufe kosten Zeit da Register gesichert und restauriert
werden müssen, und die Parameter Übergabe braucht auch ein paar
Takte.

Das alles bei einem 8-Bitter ist eben ganz schön aufwendig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Peter D. (peda)

21.06.2023 11:05

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Dieses Beispiel soll zeigen, dass die Optimierung
> durchaus nennenswert dazwischen grätschen kann.

Die mit Abstand beste Optimierung macht immer noch Brain 1.0.
Einfach mal überlegen, welche Abläufe man unnötig oft ausführt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Joachim B. (jar)

21.06.2023 11:06

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> if ( Zeit >= 6000 ){ // mm:ss
>     // Update Digits
>     Minuten = Zeit / 6000;
>     Sekunden = (Zeit/100) % 60;

wenn es so zeitkritsch wird würde ich zu oft auf Teilen und Modulo 
verzichten

Ingo L. schrieb:
> Die Funktion wird mit 1kHz aufgerufen.

1000x pro Sekunde ist Unfug, 5x bis 10x zu STRING wäre mehr als 
ausreichend und STRING Vergleiche "HH:MM:SS"geht viel schneller

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Frank M. (ukw) (Moderator)

21.06.2023 11:06

Lesenswert?

•

▲
▼

Peter D. schrieb:
> Da kein Mensch 1000 Werte je Sekunde ablesen kann, nimmt man einfach die
> ganzen Berechnungen aus dem kritischen Teil raus und führt sie nur
> einmalig je neuem Wert aus.

Genau. Allein dass hier:

> if ( Zeit >= 6000 ){ // mm:ss
>     Minuten = Zeit / 6000;
>     Sekunden = (Zeit/100) % 60;

wird 1000 mal pro Sekunde gemacht, obwohl sich die Werte nur jede 
Sekunde ändern - für die Minuten sogar nur alle 60 Sekunden.

Die Division und Modulo-Rechnung mit 10 macht das Ganze nicht beser:

> PORTD = Ziffer[Sekunden/10];
>         if ((Sekunden % 10 ) % 2 )    PORTD |= SEG_DP;

Hier empfiehlt sich, einfach folgende Variablen zu nutzen:

- Minuten_1 und Minuten_10 für Einer- und Zehnerstelle
- Sekunden_1 und Sekunden_10 für Einer- und Zehnerstelle

Diese 4 Variablen inkrementiert man zu geeigneter Zeit (bzw. setzt sie 
zurück), dann entfallen sowohl die Divisionen mit 6000 und 10 und die 
Modulo-Operationen mit 60 und 10 ebenso.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Peter D. (peda)

21.06.2023 11:50

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Der hier speichersparende Aufruf von __udivmodqi4> führt offensichrlich
> zu einer erheblichen Verlangsamung gegenüber der direkten Berechnung
> ohne Funktionsaufruf.

Du vergleichst Äpfel mit Birnen. Einmal wird eine Divisionsroutine /x 
aufgerufen. Das andere Mal wird ein optimierter Code für /10 eingefügt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Ingo L. (corrtexx)

21.06.2023 21:25

Lesenswert?

•

▲
▼

Es ging nicht darum:
- wie gehts besser
- wie macht man es richtig
sondern:
- welchen Einfluss hat der Optimizer bei ggf. Ungünstiger Programmierung

Hier in dem Beispiel, hat er signifikanten Einfluss. Dass man das 
Problem hätte umschiffen können, ganz klar. Aber bei einer Stoppuhr, die 
im 10ms Bereich auflöst und weiter nichts macht, habe ich die wenigen 
Zeilen direkt in die ISR gepackt. Hätte, wenn und aber…

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Wilhelm M. (wimalopaan)

21.06.2023 22:35

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Es ging nicht darum:
> - wie gehts besser
> - wie macht man es richtig
> sondern:
> - welchen Einfluss hat der Optimizer bei ggf. Ungünstiger Programmierung

Wie Dein Nickname schon sagt, scheinst Du so gar keine Ahnung von den 
kleinen µC zu haben. Operationen wie / oder %, die nicht durch ein shift 
und/oder Maskierung realisiert werden können, müssen dabei immer(!) ein 
Alarmzeichen sein.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Harald K. (kirnbichler)

21.06.2023 22:37

Lesenswert?

•

▲
▼

Nun, dazu kommt die Erwartungshaltung, die man an den Optimizer hat. 
Wenn Du eine Optimierung auf Geschwindigkeit erwartest, aber eine 
Optimierung auf Codegröße veranlasst, dann wird Dich das Ergebnis halt 
... überraschen.

Hast Du denn Deine Untersuchung mit einer anderen Einstellung für den 
Optimizer wiederholt?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Ingo L. (corrtexx)

22.06.2023 08:26

Lesenswert?

•

▲
▼

Harald K. schrieb:
> Hast Du denn Deine Untersuchung mit einer anderen Einstellung für den
> Optimizer wiederholt?
Ja, jede andere Einstellung, sogar -Oo, funktioniert besser als -Os

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Rolf M. (rmagnus)

22.06.2023 08:44

Lesenswert?

•

▲
▼

Es heißt zwar oft, dass man keine Mikrooptimierungen betreiben und das 
lieber dem Compiler überlassen soll, aber das bedeutet nicht, dass man 
seinen Code schreiben kann wie man will, und der Optimizer richtet das 
dann schon irgendwie. Gerade auf so kleinen µCs muss man da etwas 
umsichtiger agieren.

Ingo L. schrieb:
> Harald K. schrieb:
>> Hast Du denn Deine Untersuchung mit einer anderen Einstellung für den
>> Optimizer wiederholt?
> Ja, jede andere Einstellung, sogar -Oo, funktioniert besser als -Os

Das erstaunt mich, denn so eine Einstellung gibt es nicht.
Was verstehst du unter "besser als -Os"? Wie schon mehrfach gesagt 
wurde: Das s in -Os steht für size, also wird darauf optimiert, den 
Code kleiner zu machen, auch wenn er dadurch langsamer werden sollte. 
Exakt das passiert bei dir.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Ingo L. (corrtexx)

22.06.2023 11:40

Lesenswert?

•

▲
▼

Rolf M. schrieb:
> Das erstaunt mich, denn so eine Einstellung gibt es nicht.
-Oo => ohne Optimierung

> Was verstehst du unter "besser als -Os"?
Das Programm ist deutlich schneller

> Wie schon mehrfach gesagt
> wurde: Das s in -Os steht für size, also wird darauf optimiert, den
> Code kleiner zu machen, auch wenn er dadurch langsamer werden sollte.
> Exakt das passiert bei dir.
Ja, dass habe ich nie abgestritten

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Dergute W. (derguteweka)

22.06.2023 11:46

Lesenswert?

•

▲
▼

Moin,

Ingo L. schrieb:
> Ja, dass habe ich nie abgestritten

Aber wozu dann hier das Ganze?
Ich mach' doch auch nicht einen Thread in einem Fastfoodforum auf, weil 
ich, immer wenn ich am Imbiss Pommes bestelle, dann keine Currywurst 
bekomme, sondern - oh Wunder - Pommes.

Gruss
WK

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Rolf M. (rmagnus)

22.06.2023 11:51

Lesenswert?

•

▲
▼

Ingo L. schrieb:
> Rolf M. schrieb:
>> Das erstaunt mich, denn so eine Einstellung gibt es nicht.
> -Oo => ohne Optimierung

Nein, -Oo => Fehlermeldung
Ohne Optimierung ist -O0 (Null, kein o).

>> Was verstehst du unter "besser als -Os"?
> Das Programm ist deutlich schneller

Da es nicht die primäre Aufgabe von -Os ist, das Programm schneller zu 
machen, würde "besser als -Os" nicht "schneller", sondern "kleiner" 
bedeuten.

>> Wie schon mehrfach gesagt
>> wurde: Das s in -Os steht für size, also wird darauf optimiert, den
>> Code kleiner zu machen, auch wenn er dadurch langsamer werden sollte.
>> Exakt das passiert bei dir.
> Ja, dass habe ich nie abgestritten

Warum zeigst du dich dann so überrascht darüber, dass -Os das tut, was 
es soll?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von (prx) A. K. (prx)

22.06.2023 11:59

Lesenswert?

•

▲
▼

Im GCC kann man Optimierung auch im Quellcode sektionsweise steuern.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Rainer W. (rawi)

22.06.2023 12:10

Lesenswert?

•

▲
▼

Ingo L. schrieb:
>> Was verstehst du unter "besser als -Os"?
> Das Programm ist deutlich schneller

"Besser" oder "schlechter" kennt der Compiler nicht.
Wenn du "schneller" möchtest, musst du ihm das sagen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: -Os liefert schlechtes Ergebnis

von Ingo L. (corrtexx)

22.06.2023 12:30

Lesenswert?

•

▲
▼

@Mod
Lösch den Threat einfach löschen bitte...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Mikrocontroller und Digitale Elektronik -Os liefert schlechtes Ergebnis