Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 20:26

Lesenswert?

•

Tach allerseits.

Leider haben ATTINY keinen Barrel-Shifter.
Aus dem Wert der untersten 3 Bits von COUNT soll eine Bitmaske in DATA 
erstellt werden, count darf nicht geändert werden, eventuelle 
Hilfsregister müssen erhalten bleiben.

;-----------------
;-----------------
BITMASK:     .DB 128,64,32,16,8,4,2,1
push   zh
push   zl
push   count
ldi    zl,LOW(2*bitmask)
ldi    zh,HIGH(2*bitmask)
andi   count,7
add    zl,count
adc    zh,NULL     ;NULL ist vordefiniertes Register
lpm    data,z
pop    count
pop    zl
pop    zh
;-----------------
;Nach etwas Kaffee:
;-----------------
ldi    data,128
sbrc   count,1
ldi    data,32
sbrc   count,0
lsr    data
sbrc   count,2
swap   data



Hat jemand noch eine "schnellere" Idee?
Danke fürs lesen!

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Karl M. (Gast)

23.11.2018 22:00

Lesenswert?

•

▲
▼

Hallo,
basierend auf dieser C-Beschreibung

result = 128;
while (count > 0)
  result >>= 1;
  count --;


Ergibt sich:

ldi  result,128
tst  count
breq  exit
LSR  result
dec  count
brne  loop

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 22:48

Lesenswert?

•

▲
▼

Karl, Danke.

Ja, so mag C das machen,
leider UM LÄNGEN langsamer als die bisherige Idee.
Wobei C da sicher zuvor noch eine Stack-Orgie feiert, die auch noch 
mitgerechnet werden müsste.

Zudem wird COUNT verändert und es wird nicht berücksichtigt,
dass die oberen COUNT-Bits ev. <>0 sind.

Da ich für jeden gesparten Takt dankbar bin,
noch mal die Frage nach besseren Ideen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von spess53 (Gast)

23.11.2018 22:55

Lesenswert?

•

▲
▼

Hi

>leider UM LÄNGEN langsamer als die bisherige Idee.

Woher kommt die Forderung nach 'möglichst schnell'?

MfG Spess

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 23:06

Lesenswert?

•

▲
▼

spess53 schrieb:
> Woher kommt die Forderung nach 'möglichst schnell'?

Spielt das für die Fragestellung eine Rolle?
Um Takte zu sparen.

In einem komplexen System JEDE-EINZELNE Routine zu hinterfragen und 
vielleicht bei 20 Vorgängen jeweils paar Takte zu sparen kann "in Summe" 
sehr relevant sein wenn es z.B. um I/O-Timing geht und man bestehende 
Hardware möglichst optimal nutzen möchte.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

23.11.2018 23:09

Lesenswert?

•

▲
▼

Jim Beam schrieb:
>> Woher kommt die Forderung nach 'möglichst schnell'?
>
> Spielt das für die Fragestellung eine Rolle?

Ja.

Schnell und platzsparend sind in der Regel zwei sehr gegensätzliche 
Optimierungskriterien.

OK, die Forderung nach "schnell" stand im Eingangsposting. Nein, 
schneller als mit einer lookup table wird es nicht zu haben sein.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 23:19

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Schnell und platzsparend sind

"Platzsparend" war ja in der Fragestellung GARNICHT erwähnt.
Auch nicht im Reply von Karl. Mit keinem Wort.
Wie kommst Du völlig grundlos auf diesen Nebenkriegsschauplatz?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 23:25

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> schneller als mit einer lookup table wird es nicht zu haben sein.

DOCH:
Meine ZWEITE Idee IST ja schon schneller als die per Tabelle, wenn die 
Registersicherung eingerechnet wird, egal ob per push/pop oder Reg-Copy.

Ich fragte halt, ob jemand eine geniale Idee hat, dies weiter zu 
beschleunigen...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

23.11.2018 23:25

Lesenswert?

•

▲
▼

Jim Beam schrieb:
> Wie kommst Du völlig grundlos auf diesen Nebenkriegsschauplatz?

Wie kommst du völlig grundlos zu dieser Aggressivität in der Sprache?

Ich hatte mein Posting mittlerweile schon abgeändert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jim Beam (Gast)

23.11.2018 23:31

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Wie kommst du völlig grundlos zu dieser Aggressivität in der Sprache?

Ich bitte um Verzeihung, hat sich überschnitten, wie an den Timestamps 
ja ablesbar ist...
War wirklich nicht böse gemeint, kommt hier halt ständig vor, dass auf 
Features geantwortet wird, die garnicht Teil der Frage sind.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von H.Joachim S. (crazyhorse)

23.11.2018 23:32

Lesenswert?

•

▲
▼

"ATTiny" impliziert das schon irgendwie...
Reicht die aktuelle Lösung nicht? Oder willst du nur aus Prinzip eine 
schnellere Lösung? Man kann sehr viel Zeit in Optimierungen versenken, 
sehr oft ist es rein akademisch und wird dann in irgendeiner 
Warteschleife wieder verbraten.
Bekommt man das ganze nur mit ausgefeilten Tricks und Kniffen noch ins 
erforderliche Zeitraster, hat man schon viel früher was falsch gemacht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Karl M. (Gast)

24.11.2018 00:28

Lesenswert?

•

▲
▼

Hallo Jim Beam,

die iterative Lösung hatte ich nur der Vollständigkeit angegeben, ohne 
die notwendigen Register (Daten) zu sichern und ohne weitere Bedingungen 
zu kennen.

In meinen Programmen wähle ich im allg. auch den Zugriff auf eine 
Tabelle im Flashspeicher.
Also soweit eine gute Lösung.

Man könnte noch Daten im statisch im SRAM platzieren und über LD 
Rd,[Y,Z] oder LD Rd,X+ zugreifen.
Nur der Vollständigkeit halber, müsste man noch den Pointer [X,Y,Z] vor 
jedem Zugriff auf die Adresse des statischen Speicherbereichs setzen und 
den ihn einmalig mit {128,64,32,16,8,4,2,1} initialisieren.
Es ist aber nicht der allg. Weg, wie geschrieben.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Horst M. (horst)

24.11.2018 07:49

Lesenswert?

•

▲
▼

Nochmal zurück zur Ausgangssituation:

Die zweite Lösung ist unter den gegebenen Umständen wohl nicht zu 
toppen, aber falls bei beim Drumherum noch etwas optimiert werden 
könnte...

Die Basis, wenn der Platz im Flash keine Rolle spielt:

  push ZL
  push ZH
  ldi ZH,HIGH(bitmask<<1)
  mov ZL,count
  lpm data,Z
  .org (PC+$7f) & $ff80 ;damit's an einer 256 Byte-Grenze losgeht
bitmask:
  .db 128,64,32,16,8,4,2,1  ;1
  .db 128,64,32,16,8,4,2,1  ;2
  .db 128,64,32,16,8,4,2,1  ;32
;die Tabelle kann ggf. optimiert werden, falls count niemals einen eingeschränkten Wertebereich überschreitet


Das sind 12 Takte.
Falls das alles in einer Schleife oder unrolled hintereinander liefe, 
könnte man vllt. auf das wiederholte Sichern der Z-Register verzichten.
Damit bliebe pro Umwandlung nur noch übrig

  mov ZL,count
  lpm data,Z

und wir landen bei 4 Takten, sind damit also schneller als mit der 
zweiten Lösung.

Wenn count gleich in ZL plaziert werden kann, spart man sich das mov 
ZL,count und somit noch einen Takt.
Und falls die Tabelle im RAM gehalten werden könnte (beim Tiny dann 
nicht mehr so wahrscheinlich), käme man mit

  ld data,X

beim ultimativen 2-Takter raus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von A. S. (Gast)

24.11.2018 09:18

Lesenswert?

•

▲
▼

Also, der TO hat hier eine geniale Lösung für eine typische 
Aufgabenstellung gefunden. Respekt.

Das es Assembler ist, dass es kein Durchbruch ist, dass es mit hohen 
Einmalkosten auch schneller gehen könnte, geschenkt.

Aber das hier vom TO als echte Suche nach realer Optimierung zu 
verkaufen, ist durchsichtig. Wenn Du nicht gerade einen webserver ins 
poor man's Oszilloskop einbauen willst.

Mit poor man's meine ich das hier:

http://www.dos4ever.com/uscope/uscope_e.html

Ein Oszilloskop mit on-screen Menü und Video-ausgang in einem kleinen 
Bruder der tinys

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Axel S. (a-za-z0-9)

24.11.2018 09:47

Lesenswert?

•

▲
▼

A. S. schrieb:
> Also, der TO hat hier eine geniale Lösung für eine typische
> Aufgabenstellung gefunden.

Nein, hat er nicht. Lookup-Tabellen gibt es seit ... schon immer? Und 
daß man den Zeiger auf so eine Tabelle nach Möglichkeit wiederverwendet, 
ist auch der Normalfall  (ok, dazu braucht man genug Register, aber die 
hat ein AVR ja). Daß man die Tabelle auf eine Seitengrenze legt und 
dadurch die Indizierung vereinfacht, habe ich schon vor >25 Jahren 
gesehen. Ebenfalls ein Standard-Konstrukt.

> Respekt.

Dafür nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Justin S. (Gast)

04.01.2022 13:58

Lesenswert?

•

▲
▼

Jim Beam schrieb:

 ldi    data, 128
 sbrc   count, 1
 ldi    data, 32
 sbrc   count, 0
 lsr    data
 sbrc   count, 2
 swap   data


Genau nach so einer Lösung habe ich gesucht und finde, dass sie mehr 
Aufmerksamkeit verdient hat. Vor allem in Anbetracht dessen, dass der 
Standard-Compiler nur so etwas zustande bringt:

  unsigned char data = 0x01u << ( count & 0x07u );
     78a:  97 70         andi  r25, 0x07
     78c:  21 e0         ldi  r18, 0x01
     78e:  30 e0         ldi  r19, 0x00
     796:  ea f7         brpl  .-6        ; 0x792


Konstant 7 Takte auf einem Atmega328 sind bei etwas zeitkritischeren 
Dingen besser als die Standardlösung mit 8 + 4 * count, also zwischen 8 
und 28, im Durschnitt 18, Ersparniss bei 16MHz etwa 0.7µs pro Vorkommen.

Klingt wenig und ist normalerweise unbedeutend, aber wenn es häufig 
vorkommt und dabei z.B. Latenz wichtig ist, dann gibt es andere Stellen 
im Code, deren Optimierung deutlich weniger als eine Verdopplung bringt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Justin S. (Gast)

04.01.2022 20:41

Lesenswert?

•

▲
▼

Toll ist z.B. auch, dass einfach nur die drei "sbrc" durch "sbrs" 
ersetzt werden müssen, damit die von mir gewünschten Masken (Reihenfolge 
anders herum) erzeugt werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von H.Joachim S. (crazyhorse)

05.01.2022 00:51

Lesenswert?

•

▲
▼

Naja, die Taktzählerei...
Klar, manchmal macht es Sinn, aber äusserst selten. Es gab Zeiten da war 
es fast unerlässlich weil es einfach nichts besseres/schnelleres gab.

Wer anfängt mit einem ATTiny und dann merkt dass er um einzelne Takte 
kämpfen muss hat im Vorfeld was falsch gemacht (Aufgabe nicht 
ausreichend beleuchtet und falschen MC gewählt) und jetzt versucht durch 
die Hintertür das noch zu retten.
Das wäre noch die Variante wo man geneigt sein könnte: der lernt noch, 
hilf ihm und zeige wie es besser geht (wenn nicht daraus die Erkenntnis 
entsteht: es gibt immer einen Kniff)

Der weit häufigere Fall ist der des Selbstdarstellers: ich kann es 
besser als alle anderen, ich kann es besser als der Compiler x, ich bin 
schon irgendwie toll.
Ja, in einzelnen kleinen Abschnitten kann man mit Optimierung was 
rausholen. In einem gar nicht mal so grossen Programm gewinnt dennoch so 
gut wie immer der Compiler wenn man nicht wirklich genial und auch noch 
sehr viel Zeit hat (dann sollte man aber eher dem Compilerbauer unter 
die Arme greifen als sich in gesparten Takten zu sonnen).

Die ganz grosse Frage: was macht man mit gesparten Takten? Im Grenzfall 
können sie das System retten, im allgemeinen aber werden sie dann in 
Warteschleifen irgendeiner Art wieder verbrannt. Nutzen Null, 
Erkenntnisgewinn klein bis kontraproduktiv.

Ja, ich komme noch aus einer Zeit wo man ein Minibetriebssystem in 2 
oder 4k quetschen konnte. Und mehr oder weniger sinnvolle Software in 
wenige kB passten. Ich gebe zu ich war auch stolz dass ging wo andere 
passen mussten. Aber es hat Zeit und Gehirnschmalz gekostet, die mit 
mehr Speicher und/oder mehr Rechenleistung mit weniger als 10% (eher 
noch viel weniger) des Aufwands das gleiche Resultat erzielt hätten.

Am Limit laufende Systeme sind immer Mist, jede weitere kleine Änderung 
kann zum Kollaps führen, und diese Gefahr wird i.a. nicht mal erkannt. 
Also will ich gar keine am Limit laufenden Projekte. Bei 50% zeitlicher 
Auslastung werde ich schon hellhörig. Da muss ich noch nicht tricksen, 
habe aber noch Luft.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Justin S. (Gast)

05.01.2022 01:16

Lesenswert?

•

▲
▼

H.Joachim S. schrieb:
> Am Limit laufende Systeme sind immer Mist

Bei schnellen Systemen kommt man gar nicht mehr auf die Idee, dass sie 
am Limit laufen könnten. Eigentlich nur wenn die Kühlung länger 
unangenehm laut wird, steigt manchmal noch die Aufmerksamkeit, dass es 
die verwendeten Algorithmen vielleicht doch auch in effizient gibt.

Bei modernen CPUs ist jede gesparte Instruktion gesparter Strom. 
Besonders auffällig bei Smartphones, wo manche Apps, ohne großartig 
etwas zu tun, den Akku in kürzester Zeit leersaugen (dahinter stecken 
oft Entwicklerkits, die den gleichen Code auf vielen Plattformen laufen 
lassen können, mit Tricks, dass sich einem die Haare sträuben) und 
andere Apps (oft native programmiert und sehr klein) tun viel, ohne dass 
man es am Akku oder der Wärme des Geräts merkt.

Ich denke, es ist gut, eine CPU oder MCU oder SOC zu verwenden, die zur 
Aufgabe passt, natürlich nicht unterdimensioniert ist (so dass man mehr 
optimiert als weiterentwickelt), aber eben auch nicht überdimensioniert 
(dann merkt man im schlimmsten Fall nicht, was man da gerade 
zusammenschraubt, Beispiel Suchalgorithmen: lineare Suche ist auf 
>3GHz-Maschienen genauso schnell wie ein effizienter Suchalgorithmus, 
wenn man nicht gerade Riesendaten bearbeitet, aber er saugt viel mehr 
Strom).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Egon D. (Gast)

05.01.2022 03:11

Lesenswert?

•

▲
▼

H.Joachim S. schrieb:

> Die ganz grosse Frage: was macht man mit gesparten Takten?

Nix. Man legt das System schlafen.

Die schnellste und energieeffizienteste Anweisung ist die,
die aufgrund der Optimierung des Algorithmus überflüssig
geworden und deshalb aus dem Programm herausgeflogen ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 06:13

Lesenswert?

•

▲
▼

Jim Beam schrieb:

> BITMASK:     .DB 128,64,32,16,8,4,2,1
> push   zh
> push   zl
> push   count
> ldi    zl,LOW(2*bitmask)
> ldi    zh,HIGH(2*bitmask)
> andi   count,7
> add    zl,count
> adc    zh,NULL     ;NULL ist vordefiniertes Register
> lpm    data,z
> pop    count
> pop    zl
> pop    zh


Falls du ZL und ZH programmweit für diese eine Aufgabe reservieren 
kannst:

; BITMASK auf RAM-Adresse 0x100 legen oder auf irgendetwas anderes, wo die unteren 8 Bit immer 0x00 sind:
.org 0x100
BITMASK:     .DB 128,64,32,16,8,4,2,1


Dann bleibt von dem ganzen Lookup-Code nur noch:

push   count
andi   count,7
mov    zl,count
lpm    data,z
pop    count


ZH musst du natürlich einmalig in einer init-Routine initialisieren auf 
hi8(BITMASK).
Wenn du jetzt count noch programmweit fest immer in ZL halten kannst, 
dann fällt auch noch das mov weg.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 07:22

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> Jim Beam schrieb:

Das schrieb er vor mehr als 3 Jahren.

Einfach erstmal alles lesen und nicht nur schnell noch auf den Zug 
aufspringen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 07:35

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Das schrieb er vor mehr als 3 Jahren.

Ja, und?
Ist mein Vorschlag deshalb falsch?

> Einfach erstmal alles lesen und nicht nur schnell noch auf den Zug
> aufspringen.

Warum musst du mich hier anpissen, Herr Oberlehrer-Moderator?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 08:30

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> Jörg W. schrieb:
>> Das schrieb er vor mehr als 3 Jahren.
>
> Ja, und?
> Ist mein Vorschlag deshalb falsch?

Er wird keinen mehr interessieren.

Aber ja, bei dir wundert mich gerade gar nichts.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 08:59

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Er wird keinen mehr interessieren.

Aha. Das legst du also einfach so fest und dann ist das so. Alles klar.
Da fragt man sich doch glatt, warum Justin schrieb:

Justin S. schrieb:
> Genau nach so einer Lösung habe ich gesucht und finde, dass sie mehr
> Aufmerksamkeit verdient hat.

komisch, wo es ihn doch laut deiner Aussage nicht interessiert.

Abgesehen davon habe ich den Thread vor meiner Antwort komplett 
gelesen. Deine Unterstellung, ich hätte das nicht getan, ist einfach nur 
unredlich.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Peter D. (peda)

05.01.2022 09:30

Lesenswert?

•

▲
▼

H.Joachim S. schrieb:
> Naja, die Taktzählerei...
> Klar, manchmal macht es Sinn, aber äusserst selten.

Das erinnert mich an meine ersten Schritte mit dem AT89C2051. Da hatte 
ich auch jeden Zyklus gezählt.
Später auf Arbeit hatte ich dann Zugriff auf den Keil C51. Ich hab das 
Programm umgeschrieben, es wurde kleiner und deutlich schneller. 
Zeitkritisch war durch die Umstellung des Ablaufs nichts mehr und ich 
konnte sogar weitere Funktionen hinzufügen.

Fazit:
Die beste Optimierung erreicht man mit Durchdenken des Ablaufs und nicht 
durch Mikrooptimierung einzelner Instruktionen.
Nebeneffekt: Bessere und kürzere Algorithmen sind oft auch besser 
lesbar, wenn man das Programm nach Jahren mal wieder betrachtet.
Mikrooptimierung muß dagegen immer auch kommentiert werden, warum man 
was und wie gemacht hatte.

https://devnarrative.com/mikrooptimierung/

"Premature optimization is the root of all evil."

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Oliver S. (oliverso)

05.01.2022 09:49

Lesenswert?

•

▲
▼

Die Zeiten ändern sich halt. Früher(tm) galt sich selbst modifizierender 
Assemblercode oder sowas wie Duff's Device als hohe Programmierkunst.

Trotzdem ist die Lösung des TO für die Aufgabenstellung elegant und 
vollständig. Mit passenden Kommentaren gibt es keinen Grund, die nicht 
einzusetzen.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Martin (Gast)

05.01.2022 09:59

Lesenswert?

•

▲
▼

> "Premature optimization is the root of all evil."

Ist nur eine belanglose Meinung ohne jeglichen Tiefgang, da es in der 
Praxis der Programmierung auf die Umstände ankommt  (Speicher sparen, 
Zeit sparen, etc.).

> ... elegant und vollständig ...

So ist es.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 10:17

Lesenswert?

•

▲
▼

Martin schrieb:
>> "Premature optimization is the root of all evil."
>
> Ist nur eine belanglose Meinung ohne jeglichen Tiefgang

Keineswegs.

Du hast das "premature" offenbar überlesen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von (prx) A. K. (prx)

05.01.2022 10:19

Lesenswert?

•

▲
▼

Oliver S. schrieb:
> Die Zeiten ändern sich halt. Früher(tm) galt sich selbst modifizierender
> Assemblercode oder sowas wie Duff's Device als hohe Programmierkunst.

Selbstmodifizierender Assemblercode ist bei AVRs immer noch hohe 
Programmierkunst. ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Peter D. (peda)

05.01.2022 10:29

Lesenswert?

•

▲
▼

Oliver S. schrieb:
> Früher(tm) galt sich selbst modifizierender
> Assemblercode oder sowas wie Duff's Device als hohe Programmierkunst.

Ich kenne selbst modifizierenden Code nur zur Verschleierung als 
Kopierschutz, um das Debuggen zu erschweren. Ein Beispiel für einen 
wirklich sinnvollen Einsatz habe ich noch nie gesehen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von (prx) A. K. (prx)

05.01.2022 10:42

Lesenswert?

•

▲
▼

Peter D. schrieb:
> Ein Beispiel für einen
> wirklich sinnvollen Einsatz habe ich noch nie gesehen.

Fehlende Befehle. Intels 8080 hatte keine Befehle für indirekte I/O. 
Adressierung über (C) kam erst mit Z80.

Die 1-Chip-Implementierung des früher sehr erfolgreichen 
Microcontrollers Fairchild F8 hatte 64 Bytes ausführbares RAM am Ende 
des ROM-Adressraums. Sicherlich nicht ohne Grund.

Mangels Return-Stack bestand eine Methode von Unterprogrammaufrufen auf 
Computern der ersten Jahrzehnte darin, den passenden Rücksprungbefehl an 
den Anfang des Unterprogramms zu schreiben und dann an die darauf 
folgende Adresse zu springen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Oliver S. (oliverso)

05.01.2022 10:56

Lesenswert?

•

▲
▼

(prx) A. K. schrieb:
> Selbstmodifizierender Assemblercode ist bei AVRs immer noch hohe
> Programmierkunst. ;-)

Wo ist das Problem ? ;)

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Martin C. (Gast)

05.01.2022 11:31

Lesenswert?

•

▲
▼

Peter D. schrieb:
> Ein Beispiel für einen
> wirklich sinnvollen Einsatz habe ich noch nie gesehen.

Im C64 gab es eine selbstmodifizierende Routine in der Zeropage, die das 
nächste Zeichen aus dem Basic-Programm holte. Dadurch konnte statt 
indirekter Adressierung die schnellere absolute Adressierung verwendet 
werden.

https://www.c64-wiki.de/wiki/CHRGET

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 11:39

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> Falls du ZL und ZH programmweit für diese eine Aufgabe reservieren
> kannst:

> Dann bleibt von dem ganzen Lookup-Code nur noch:
> .cseg
> push   count
> andi   count,7
> mov    zl,count
> lpm    data,z
> pop    count

Die Lösung vom TO ist schneller, Platzsparender und hat nicht die 
Einschränkungen (ZH fest belegt, Tabelle an einer festen Grenze im 
kleinen Speicher)


Jörg W. schrieb:
> Bitfrickler schrieb:
>> Jim Beam schrieb:
>
> Das schrieb er vor mehr als 3 Jahren.

Wieso machst Du ihn an? Er hat das Ding nicht wieder hervorgekramt!

Jörg W. schrieb:
> Er wird keinen mehr interessieren.

Dann können wir die ganzen alten Threads doch löschen. Dann verschwindet 
die ganze Problematik mit den ständig ausgegrabenen Leichen auch.
Und Justin der Übeltäter hätte vielleicht eine nicht so elegante Lösung 
bekommen.


Oliver S. schrieb:
> Wo ist das Problem ? ;)

Das Flash franst dabei so schnell aus ...


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Martin C. (Gast)

05.01.2022 11:41

Lesenswert?

•

▲
▼

Oliver S. schrieb:
> (prx) A. K. schrieb:
>> Selbstmodifizierender Assemblercode ist bei AVRs immer noch hohe
>> Programmierkunst. ;-)
>
> Wo ist das Problem ? ;)
>
> Oliver

AVR-Programme laufen nur aus dem Flash, nie aus dem RAM 
(Harvard-Architektur?).

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 11:41

Lesenswert?

•

▲
▼

Peter D. schrieb:
> Ein Beispiel für einen wirklich sinnvollen Einsatz habe ich noch nie
> gesehen.

Beim Z80 konnte man separaten Datenspeicher sparen, indem man den 
Direktoperanden eines Befehls als Variable missbraucht hat. Sowas wurde 
meiner Erinnerung nach selbst im CP/M-BDOS gemacht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 11:43

Lesenswert?

•

▲
▼

Martin C. schrieb:
> AVR-Programme laufen nur aus dem Flash, nie aus dem RAM
> (Harvard-Architektur?).

Und? Den kann man zur Laufzeit doch beschreiben!? ;-)

Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Oliver S. (oliverso)

05.01.2022 11:55

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Martin C. schrieb:
>> AVR-Programme laufen nur aus dem Flash, nie aus dem RAM
>> (Harvard-Architektur?).
>
> Und? Den kann man zur Laufzeit doch beschreiben!? ;-)

Eben. Bringt zwar die Einschränkung mit, daß man nur ganze pages 
schreiben kann, aber ansonsten ist das doch peanuts ;)

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Martin (Gast)

05.01.2022 12:00

Lesenswert?

•

▲
▼

Jörg W. schrieb:
> Martin schrieb:
>>> "Premature optimization is the root of all evil."
>>
>> Ist nur eine belanglose Meinung ohne jeglichen Tiefgang
>
> Keineswegs.
>
> Du hast das "premature" offenbar überlesen.

Habe ich nicht überlesen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 12:39

Lesenswert?

•

▲
▼

Oliver S. schrieb:
> Eben. Bringt zwar die Einschränkung mit, daß man nur ganze pages
> schreiben kann, aber ansonsten ist das doch peanuts ;)

Naja, Nullen kann man immer hinzufügen. Nur auf 1 setzen geht 
Seitenweise.
Dann braucht man eben noch ein System, mit dem man ungültige Stellen 
markieren kann, eine Art Dateisystem. Vielleicht sogar etwas Wear 
Levelling.
Und dann einen kleinen Kompiler auf dem System, welcher selbst Code 
dafür erstellen kann. Evtl. Multitasking?
Vielleicht etwas größeres nehmen. Raspi!? Ach - der macht das ja schon 
... :-D

Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 12:43

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Die Lösung vom TO ist schneller

Ist sie das? Ich habe jetzt nicht mehr alle Instruktionslaufzeiten im 
Kopf, aber hat die zweite Lösung vom Threadersteller nicht 7 Takte und 
mein Vorschlag nur 6 Takte und mit dem count-nach-ZL-Vorschlag sogar nur 
5 Takte.

Dass mein Vorschlag deutlich eingeschränkter ist, ist ja klar.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 12:50

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> Ist sie das?

Bitfrickler schrieb:
> push   count
2
> andi   count,7
1
> mov    zl,count
1
> lpm    data,z
3
> pop    count
2

=9

Bitfrickler schrieb:
> Ich habe jetzt nicht mehr alle Instruktionslaufzeiten im
> Kopf

Hättest Du aber schnell selber nachsehen können.


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 13:33

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Hättest Du aber schnell selber nachsehen können.

Ja, nach der Logik hättest du es auch direkt sagen können. Du wusstest 
es ja offenbar.

Warum wird man hier im Forum ständig grundlos unfreundlich angepampt?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Oliver S. (oliverso)

05.01.2022 13:36

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Bitfrickler schrieb:
>> Ist sie das?
>
> Bitfrickler schrieb:
>> push   count
> 2

oder 3, bei AVRs mit 3-Byte Programmzähler.

Oliver

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 13:47

Lesenswert?

•

▲
▼

Man muss count ja auch überhaupt gar nicht pushen, wenn man ZL/ZH 
sowieso reserviert:

.org 0x100
BITMASK:     .DB 128,64,32,16,8,4,2,1
mov    zl,count
andi   zl,7
lpm    data,z


5 Takte und damit schneller als die Lösung des Threaderstellers.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 14:10

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> Man muss count ja auch überhaupt gar nicht pushen, wenn man ZL/ZH
> sowieso reserviert:
> .dseg
> .org 0x100
> BITMASK:     .DB 128,64,32,16,8,4,2,1
> .cseg
> mov    zl,count
> andi   zl,7
> lpm    data,z
>
> 5 Takte und damit schneller als die Lösung des Threaderstellers.

Und wenn man dann die Tabelle bei der Initialisierung ins RAM legt, 
spart man noch einen Takt.

Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Yalu X. (yalu) (Moderator)

05.01.2022 14:49

Lesenswert?

•

▲
▼

Bitfrickler schrieb:
> 5 Takte und damit schneller als die Lösung des Threaderstellers.

Dass man durch die Hinzunahme geeigneter Vorbedingungen einen Code
(fast) beliebig schnell machen kann, ist keine Überraschung. Allerdings
ist das auch oft mit Nachteilen verbunden. In deinem Fall sind dies die
folgenden:

Die globale Reservierung eines der drei wertvollen Registerpaare schlägt
bei einem nicht ganz trivialen Programm mit hoher Wahrscheinlichkeit an
anderer Stelle zurück, so dass sich deine "Optimierung" schnell ins
Gegenteil verkehrt.

Das 256-Byte-Alignment der Tabelle wird problematisch, wenn bspw. bei
einem ATtiny13 mehr als 75% des Flash für Programmcode genutzt werden.
Man kann dann den Code zwar in zwei Teile (vor und nach der Tabelle)
aufsplitten, allerdings ist er dadurch nur noch schwer wartbar.

Der Code des TE hingegen setzt überhaupt nichts voraus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jobst M. (jobstens-de)

05.01.2022 15:08

Lesenswert?

•

▲
▼

Yalu X. schrieb:
> Das 256-Byte-Alignment der Tabelle wird problematisch, wenn bspw. bei
> einem ATtiny13 mehr als 75% des Flash für Programmcode genutzt werden.

Man kann die Tabelle auch an das Ende eines Segments (Ende des ROMs) 
setzen und anstelle

andi   zl,7

1	ori zl,248

schreiben.


> Der Code des TE hingegen setzt überhaupt nichts voraus.

Was ihn (den Code!) sehr sexy macht.


Gruß
Jobst

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Egon D. (Gast)

05.01.2022 15:47

Lesenswert?

•

▲
▼

Peter D. schrieb:

> Das erinnert mich an meine ersten Schritte mit dem
> AT89C2051. Da hatte ich auch jeden Zyklus gezählt.
> [...]
> Die beste Optimierung erreicht man mit Durchdenken des
> Ablaufs und nicht durch Mikrooptimierung einzelner
> Instruktionen.

Ich finde, hier wird künstlich ein Widerspruch aufgebauscht,
der so gar nicht existiert.

Erstens spricht m.E. nichts dagegen, universelle Grund-
funktionen so weit als irgend möglich zu optimieren,
solange deren Universalität dadurch nicht leidet. Ob
eine eingesparte Mikrosekunde viel oder wenig ist, hängt
nämlich davon ab, wie lang die Routine insgesamt ist
und wie oft sie aufgerufen wird.

Zweitens kann Takte zählen gerade auf großen, modernen
Maschinen zu verblüffenden Einsichten führen, wenn man
ergänzend noch die reale Programmlaufzeit misst und
dann gründlich über die Diskrepanzen nachdenkt -- der
Datencache lässt grüßen...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Bitfrickler (Gast)

05.01.2022 15:56

Lesenswert?

•

▲
▼

Jobst M. schrieb:
> Und wenn man dann die Tabelle bei der Initialisierung ins RAM legt,
> spart man noch einen Takt.

Ok, ja. Mein Fehler. Bei meinem Beispiel liegt sie ja bereits im RAM. 
Also war LPM falsch.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 16:07

Lesenswert?

•

▲
▼

Egon D. schrieb:
> Erstens spricht m.E. nichts dagegen, universelle Grund-
> funktionen so weit als irgend möglich zu optimieren

Wobei es fraglich ist, inwiefern man eine Funktion, die aus einem 
Eingangs-Wertebereich von exakt 0 bis 7 eine Bitmaske generiert (so cool 
die Lösung des TE durchaus ist), nun schon als "universelle 
Grundfunktion" durchgeht. ;-)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von c-hater (Gast)

05.01.2022 16:19

Lesenswert?

•

▲
▼

Jörg W. schrieb:

> Wobei es fraglich ist, inwiefern man eine Funktion, die aus einem
> Eingangs-Wertebereich von exakt 0 bis 7 eine Bitmaske generiert (so cool
> die Lösung des TE durchaus ist), nun schon als "universelle
> Grundfunktion" durchgeht. ;-)

Du bist ja nicht mal in der Lage, die Funktion dieser einfachen Routine 
korrekt zu beschreiben und maßt dir an, Postings zu löschen. Mit welchem 
gottverdammten Recht? Fachliche Kompetenz kann es jedenfalls nicht sein!

Nein, natürlich macht die Routine deutlich mehr, da ihr 
Eingangs-Wertebereich 0..255 umfaßt.

Wäre anderweitig garantiert, dass tatsächlich nur Werte von 0..7 am 
Eingang vorkommen, gäbe es auch noch andere Lösungen, die die Effizienz 
der "Jim-Beam-Routine" erreichen.

Und Leute wie du sind wesentlich verantwortlich für den avr-gcc? Da 
wundert es echt niemanden, dass der so Scheiße ist, wie er halt ist...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Egon D. (Gast)

05.01.2022 16:42

Lesenswert?

•

▲
▼

Jörg W. schrieb:

> Egon D. schrieb:
>> Erstens spricht m.E. nichts dagegen, universelle Grund-
>> funktionen so weit als irgend möglich zu optimieren
>
> Wobei es fraglich ist, inwiefern man eine Funktion, die
> aus einem Eingangs-Wertebereich von exakt 0 bis 7 eine
> Bitmaske generiert (so cool die Lösung des TE durchaus ist),
> nun schon als "universelle Grundfunktion" durchgeht. ;-)

Gegenfrage: Wieso eigentlich nicht?

Ich bin nicht der Nabel der Welt; nicht alles, dessen
Nutzen ich nicht verstehe, muss deshalb gleich nutzlos
sein.
Andere finden es vielleicht nutzlos, alle geraden Bit-
positionen aus der X-Koordinate und die ungeraden aus
der Y-Koordinate zu gewinnen -- und doch berechnet man
den MORTON-Code genau so...


Davon abgesehen ging es mir eigentlich mehr um "Takte
zählen ist bäh!": Wie anders -- außer eben durch Takte
zählen, reale Laufzeit messen und beides vergleichen --
soll ich herausbekommen, wo sich die cache misses bei
den Datenzugriffen verstecken?
Wenn 10 Befehle in gemessenen 7 Taktzuständen ausgeführt
werden, dann ist auf dem uralten Athlon 64 das Ende der
Fahnenstange ziemlich nahe. Wenn aber 10 Befehle 20 Takte
dauern, gibt es noch Optimierungspotenzial.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 16:42

Lesenswert?

•

▲
▼

c-hater schrieb:
> Du bist ja nicht mal in der Lage, die Funktion dieser einfachen Routine
> korrekt zu beschreiben und maßt dir an, Postings zu löschen.

Gelöscht wird hier Moby, weil er Hausverbot hat.

Ansonsten hast du vom AVR-GCC und seiner Entwicklung offenbar keine 
Ahnung, aber das musst du auch nicht für solche Postings.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Jörg W. (dl8dtl) (Moderator)

05.01.2022 16:46

Lesenswert?

•

▲
▼

Egon D. schrieb:
> Ich bin nicht der Nabel der Welt; nicht alles, dessen
> Nutzen ich nicht verstehe, muss deshalb gleich nutzlos
> sein.

Ich habe ja auch nicht behauptet, dass hier irgendwas nutzlos wäre. 
Zwischen "nutzlos" und "universeller Grundfunktion" liegt aber ein recht 
großer Bereich.

(Übers Zählen von Takten habe ich mich eh nicht ausgelassen.)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von Egon D. (Gast)

05.01.2022 17:25

Lesenswert?

•

▲
▼

Jörg W. schrieb:

> Egon D. schrieb:
>> Ich bin nicht der Nabel der Welt; nicht alles, dessen
>> Nutzen ich nicht verstehe, muss deshalb gleich nutzlos
>> sein.
>
> Ich habe ja auch nicht behauptet, dass hier irgendwas
> nutzlos wäre. Zwischen "nutzlos" und "universeller
> Grundfunktion" liegt aber ein recht großer Bereich.
>
> (Übers Zählen von Takten habe ich mich eh nicht ausgelassen.)

Ich meine mit "universell" nur "ist allgemeingültig".
Nicht universell ist, was nur in Spezialfällen klappt.

Wie oft man die konkrete Funktion praktisch benötigt,
ist mir erstmal egal. Eine Toilette braucht mach i.d.R.
auch nur selten -- dann aber u.U. dringend...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Schnelle Bitmaske in AVR-Assembler

von mIstA (Gast)

08.01.2022 00:26

Lesenswert?

•

▲
▼

Egon D. schrieb:
> Eine Toilette braucht mach i.d.R. auch nur selten

Also mehrmals täglich, an so gut wie jedem Tag Deines Lebens seit Du dem 
Kleinkindesalter entwachsen bist; also wirklich selten ist das jetzt 
nicht gerade.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Mikrocontroller und Digitale Elektronik Schnelle Bitmaske in AVR-Assembler