Forum: Mikrocontroller und Digitale Elektronik Memset via schleife

von Michael (Gast)

10.10.2007 08:22

Lesenswert?

•

Hallo,


ich möchte die variable cache mit 0x00 initialisieren.
Kann mir jemand kurz erläutern welche Variante die bessere oder 
schnellere ist?

char cache[1024];
//Variante 1
for (int i=0;i<1024;i++)  cache[i] =0x00;
//Variante 2
memset(cache,0x00,sizeof(cache));


HW: ATMEGA128

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Memset via schleife

von Rolf Magnus (Gast)

10.10.2007 08:29

Lesenswert?

•

▲
▼

Ich würde schätzen, daß auf einem AVR beide gleich schnell sind.
Es würde mich nicht wundern, wenn der Compiler erkennt, was die 
for-Schleife tut und diese automatisch durch einen memset-Aufruf 
ersetzt. Dieser wiederum wird (zumindest bei GCC) vom Compiler selbst 
intern dann in die optimale Variante für den jeweiligen Prozessor 
umgesetzt.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Memset via schleife

von Falk B. (falk)

10.10.2007 08:36

Lesenswert?

•

▲
▼

@ Rolf Magnus (Gast)

>Ich würde schätzen, daß auf einem AVR beide gleich schnell sind.

ICh würde schätzen, dass memset() schneller ist, weil es handoptimiert 
ist (ASM?).

>Es würde mich nicht wundern, wenn der Compiler erkennt, was die
>for-Schleife tut und diese automatisch durch einen memset-Aufruf
>ersetzt.

Würde ich nicht drauf spekulieren.

> Dieser wiederum wird (zumindest bei GCC) vom Compiler selbst
>intern dann in die optimale Variante für den jeweiligen Prozessor
>umgesetzt.

Praktisch. Simulier einfach mal beide im AVR Studio und schau dir die 
benötigten Taktzyklen an.

MFG
Falk

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Memset via schleife

von Rolf Magnus (Gast)

10.10.2007 10:44

Lesenswert?

•

▲
▼

> ICh würde schätzen, dass memset() schneller ist, weil es handoptimiert
> ist (ASM?).

Naja, beim AVR gibt's nicht viele Möglichkeiten, einen Speicherblock zu 
kopieren, und der C-Code für die Schleife ist so einfach, daß ich schon 
mit einem optimalen Ergebnis gerechnet hätte.

> Simulier einfach mal beide im AVR Studio und schau dir die
> benötigten Taktzyklen an.

Ich habe kein AVR-Studio, aber ich kann mir den ASM-Code anschauen:

For-Schleife:

        ldi r30,lo8(cache)
        ldi r31,hi8(cache)
        st Z+,__zero_reg__
        ldi r24,hi8(cache+1024)
        cpi r30,lo8(cache+1024)
        cpc r31,r24
        brne .L2


memcpy:

        ldi r24,lo8(1024)
        ldi r25,hi8(1024)
        ldi r30,lo8(cache)
        ldi r31,hi8(cache)
        st Z+,__zero_reg__
        sbiw r24,1
        brne .-6


Die memcpy-Variante ist tatsächlich pro Durchlauf einen Taktzyklus 
schneller, aber nur weil bei der for-Schleife das Register r24 in jedem 
Schleifendurchlauf unnötigerweise neu geladen wird. Sonst wären die 
beiden gleich schnell.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net