PAritätszähler unglaublich langsam auf ATSAMD

von Harstad (Gast)

17.07.2020 11:22

Lesenswert?

•

Hi,

ich habe hier eine simple Bitzählroutine, die mir ermittelt, wie viele 
1er Bits in einem Wert vorkommen und diese dann mit einem 
Paritäts-Zähler vergleicht:

static __attribute__((always_inline)) char parityOK(const uint_fast32_t vx,const uint_fast32_t vy)
   uint_fast32_t bitmask=0x00200000;
   uint_fast8_t  cx=0,cy=0;
   while (bitmask>0x00000002)
      if ((vx & bitmask)==bitmask) cx++;
      if ((vy & bitmask)==bitmask) cy++;
      bitmask=bitmask>>1;
   if ((vx & 0x00000003)!=(cx & 0x00000003))
      return 0;
   if ((vy & 0x00000003)!=(cy & 0x00000003))
      return 0;
   return 1;


vx und vy sind dabei 22-Bit-Zahlenwerte. In den oberen 20 Bits wird 
gezählt, wie viele Einsen darin vorkommen und das Ergebnis wird mit dem 
in den unteren zwei Bits stehenden Zahlenwert verglichen (da natürlich 
nur die unteren 2 Bit/max. 3 Werte, alles was darüber hinausgeht, wird 
ignoriert, da nicht angenommen wird, dass mehr als 3 Bits gleichzeitig 
kippen).

Mein Problem: dafür, dass diese Funktion so simpel ist, ist sie auf 
einem mit 120 MHz getakteten ATSAMD unglaublich langsam und haut mir 
mein ganzes Timing durcheinander.

Meine Frage jetzt: wie kann man das optimieren? Gibt es vielleicht eine 
Funktion, mit der man die CPU die Bits zählen lassen kann, so dass ich 
mir diese Schleife sparen kann?

Danke!

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von ooops (Gast)

17.07.2020 11:27

Lesenswert?

•

▲
▼

Harstad schrieb:
> ist sie auf
> einem mit 120 MHz getakteten ATSAMD unglaublich langsam

Wie langsam ist denn "unglaublich"?

Hab gerade meine Formelsammlung mit den Konstantendefinitionen
nicht greifbar.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Harstad (Gast)

17.07.2020 11:30

Lesenswert?

•

▲
▼

ooops schrieb:
> Harstad schrieb:
>> ist sie auf
>> einem mit 120 MHz getakteten ATSAMD unglaublich langsam
>
> Wie langsam ist denn "unglaublich"?
>
> Hab gerade meine Formelsammlung mit den Konstantendefinitionen
> nicht greifbar.

So langsam, dass es für meine Belange zu langsam ist. Für die 
Fragestellung ist diese Information übrigens komplett unwichtig, 
schließlich möchte ich wissen, wie man das optimieren kann und nicht, ob 
der Prozessor richtig arbeitet.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von blub (Gast)

17.07.2020 11:36

Lesenswert?

•

▲
▼

Schau mal nach ,,Brian Kernighan Algorithm" zum Bit-Zählen!

ich zitiere:

>We calculate n-1
>We and it with n i.e n&(n-1)
>Thus unset the rightmost bit
>Keep repeating the above steps until we end up with 0

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Jörg W. (dl8dtl) (Moderator)

17.07.2020 11:38

Lesenswert?

•

▲
▼

https://stackoverflow.com/questions/697978/c-code-to-count-the-number-of-1-bits-in-an-unsigned-char

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von hmmm (Gast)

17.07.2020 11:51

Lesenswert?

•

▲
▼

Ich schmeiß mal __builtin_popcount in die Runde - keine Ahnung, was das 
beim ATSAMD ergibt...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von hmmm (Gast)

17.07.2020 11:53

Lesenswert?

•

▲
▼

Ich bin einfach mal vom gcc ausgegangen...
__builtin_parity gäb's auch noch.
 --> https://gcc.gnu.org/onlinedocs/gcc/Other-Builtins.html

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Jörg W. (dl8dtl) (Moderator)

17.07.2020 11:57

Lesenswert?

•

▲
▼

hmmm schrieb:
> Ich schmeiß mal __builtin_popcount in die Runde - keine Ahnung, was das
> beim ATSAMD ergibt...

Ergibt mit -mcpu=cortex-m0 -mthumb das hier:

00008128 <__popcountsi2>:
    8128:       4a09            ldr     r2, [pc, #36]   ; (8150 <__popcountsi2+0x28>)
    812a:       0843            lsrs    r3, r0, #1
    812e:       1ac0            subs    r0, r0, r3
    8132:       4a08            ldr     r2, [pc, #32]   ; (8154 <__popcountsi2+0x2c>)
    813a:       181b            adds    r3, r3, r0
    813c:       0918            lsrs    r0, r3, #4
    813e:       18c0            adds    r0, r0, r3
    8140:       4b05            ldr     r3, [pc, #20]   ; (8158 <__popcountsi2+0x30>)
    8146:       18c0            adds    r0, r0, r3
    814a:       18c0            adds    r0, r0, r3
    814c:       0e00            lsrs    r0, r0, #24
    8158:       0f0f0f0f        .word   0x0f0f0f0f

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Patrick (Gast)

17.07.2020 11:58

Lesenswert?

•

▲
▼

Ich würde mir für ein nibble (Werte 0 bis 15) ein Konstantes Array als 
Lookup-Tabelle machen. Dann hast du nur noch ein Viertel der 
Iterationen. Kannst das ganze auch auf ein ganzes Byte hochziehen, dann 
hätte deine Lookuptabelle 256 Einträge (mehr Speicher, mehr 
Geschwindigkeit) Die Tabelle würde ich global definieren, damit sie 
nicht jedes mal auf den Stack geschaufelt wird.

Vom Prinizp her:

vxkop =vx;
while (vxkop)
cx += bitspronibble [ vxkop & 0x0F ];
vxkop = vxkop >> 4;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Rudolph R. (rudolph)

17.07.2020 12:43

Lesenswert?

•

▲
▼

Harstad schrieb:
> Mein Problem: dafür, dass diese Funktion so simpel ist, ist sie auf
> einem mit 120 MHz getakteten ATSAMD unglaublich langsam und haut mir
> mein ganzes Timing durcheinander.

Ich habe das gerade mal ausprobiert auf einem ATSAME51J19A der auf 
120MHz läuft, also bis auf das der zusätzlich CAN hat der gleiche 
Controller.

Ich messe die Ausführungsgeschwindigkeit der Funktion mit einem Timer 
der auf dem internen RC-Oscillator läuft mit TC_CTRLA_PRESCALER_DIV2, 
also 24 MHz.

...
num_profile_a = parityOK(val_a, val_b);
...
val_a+=23;
val_b+=47;
val_a &= 0x0002ffffd;
val_b &= 0x0002ffffd;

Ein bisschen "Chaos" rein gefüttert damit das nicht weg optimiert wird.
Das "num_profile_a" ist in dem Zusammenhang einfach nur eine Variable 
die woanders auch noch benutzt und demnach nicht weg optimiert wird.

Die Funktion habe ich einfach so übernommen, das führt zu der Warnung:
"warning: always_inline function might not be inlinable [-Wattributes]"

Wie auch immer, das Ergebnis sind konstante 49 Timer-Ticks, oder auch 
2µs.
Oder auch 240 Taktzyklen bezogen auf die 120MHz Core-Takt.

Zu langsam mag ja gut sein, aber ist "unglaublich langsam" nicht doch 
ein klein wenig übertrieben?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Rudolph R. (rudolph)

17.07.2020 13:03

Lesenswert?

•

▲
▼

Okay, so braucht das 17 Timer-Ticks:

static __attribute__((always_inline)) char parityOK(const uint_fast32_t vx,const uint_fast32_t vy)
  uint_fast8_t  cx=0,cy=0;
  cx = __builtin_popcountl (vx & 0x003ffffc);
  cy = __builtin_popcountl (vy & 0x003ffffc);
  if ((vx & 0x00000003)!=(cx & 0x00000003))
    return 0;
  if ((vy & 0x00000003)!=(cy & 0x00000003))
    return 0;
  return 1;

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von M. K. (Gast)

17.07.2020 13:09

Lesenswert?

•

▲
▼

Du bist Dir aber sicher, das nicht irgendein IRQ da reingrätscht?
Wackel mal mit einem PIN in Deiner Schleife und seh Dir an wie konstant 
und wie lange der überhaupt darin herumwerkelt.
Ist überhaupt sichergestellt das diese Routine mit höchster Prio läuft 
und andere Prozesse unterbrechen kann?

Harstad schrieb:
> So langsam, dass es für meine Belange zu langsam ist.

Das ist keine Aussage.
Wie langsam und wie sind Deine Belange?
Schau Dir an was der Compiler daraus macht und zähl die Takte.
Ggf. ist das Softwaremäßig garnicht zu lösen.
Wir wissen ja nicht wohl Du hinwillst mit dem Timing und was der 
Rechenknecht noch alles tun muss.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Egon D. (Gast)

17.07.2020 13:18

Lesenswert?

•

▲
▼

M. K. schrieb:

> Schau Dir an was der Compiler daraus macht
> und zähl die Takte.

Nicht notwendig.

Er behandelt jedes Bit einzeln, d.h. es gibt
20 Durchläufe mit etwa 3 Befehlen je Durchlauf.

Vergleiche das mit Jörgs Assemblertext: Der
braucht 20 Befehle .

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Jörg W. (dl8dtl) (Moderator)

17.07.2020 13:20

Lesenswert?

•

▲
▼

Egon D. schrieb:
> Vergleiche das mit Jörgs Assemblertext

Nicht meiner, sondern der der libgcc. ;-) (Die wird hinter dem genannten 
__builtin_popcount() vom Compiler aufgerufen.)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Rudolph R. (rudolph)

17.07.2020 13:24

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Ergibt mit -mcpu=cortex-m0 -mthumb das hier:

Gerade erst gesehen, der Controller ist aber ein M4F.
Das kommt dabei raus wenn man nur "SAMD" schreibt und nicht die Nummer 
dazu.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Egon D. (Gast)

17.07.2020 13:25

Lesenswert?

•

▲
▼

Jörg W. schrieb:

> Egon D. schrieb:
>> Vergleiche das mit Jörgs Assemblertext
>
> Nicht meiner, sondern der der libgcc. ;-)

Ich weiss.
Du bist halt der Überbringer der Nachricht,
nicht der Verfasser :)

Die Routine ist übrigens ziemlich hoch optimiert;
besonders das Umschwenken auf die Addition der
8Bit-Gruppen am Ende finde ich elegant, das spart
nochmal ein paar Befehle.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Jörg W. (dl8dtl) (Moderator)

17.07.2020 13:26

Lesenswert?

•

▲
▼

Rudolph R. schrieb:
> Jörg W. schrieb:
>> Ergibt mit -mcpu=cortex-m0 -mthumb das hier:
>
> Gerade erst gesehen, der Controller ist aber ein M4F.
> Das kommt dabei raus wenn man nur "SAMD" schreibt und nicht die Nummer
> dazu.

OK, hier nochmal mit -mcpu=cortex-m4 -mthumb. Wird kürzer. :)

0000812c <__popcountsi2>:
    812c:       0843            lsrs    r3, r0, #1
    8132:       1ac0            subs    r0, r0, r3
    8140:       eb00 1010       add.w   r0, r0, r0, lsr #4
    8144:       f000 300f       and.w   r0, r0, #252645135      ; 0xf0f0f0f
    8148:       eb00 2000       add.w   r0, r0, r0, lsl #8
    814c:       eb00 4000       add.w   r0, r0, r0, lsl #16
    8150:       0e00            lsrs    r0, r0, #24

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Jörg W. (dl8dtl) (Moderator)

17.07.2020 13:28

Lesenswert?

•

▲
▼

Egon D. schrieb:
> Die Routine ist übrigens ziemlich hoch optimiert;

Dafür ist es ja auch gut, wenn man für solcherlei Dinge Informatiker 
hat, die einem das als Library zur Verfügung stellen.

Der oben gegebene Hinweis auf __builtin_popcount() war daher m.E. der 
wirklich zielführendste im Thread.

(Zu Hause steht noch irgendwo das Buch "Hacker's Delight" rum, da sind 
solche Algorithmen für Standardaufgaben erklärt. Hatte ich vorhin nicht 
zur Hand.)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Peter D. (peda)

17.07.2020 13:29

Lesenswert?

•

▲
▼

https://en.wikipedia.org/wiki/Hamming_weight

Interessant ist popcount64d(), wenn nur wenige Bits gesetzt sind.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PAritätszähler unglaublich langsam auf ATSAMD

von Harstad (Gast)

17.07.2020 15:04

Lesenswert?

•

▲
▼

Cool, danke, damit kann ich was anfangen :-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Mikrocontroller und Digitale Elektronik PAritätszähler unglaublich langsam auf ATSAMD