Prozessorauslastung bei SPI

von Horst (Gast)

31.07.2007 21:00

Lesenswert?

•

Halloo

Angenommen, ich schreiben Bytes über SPI zu einem Slave.
Der Master (hier der µC) schreibt byteweise in ein SPI-Datenregister und 
setzt danach ein Tx-Request. Dann sollten doch mit dem SCK-Takt über die 
MISO und MOSI Leitungen die Bits weitergeschoben werden.

Frage ist nun: Zu dem Zeitpunkt, nachdem das Byte in das SPI-Register 
geschrieben wurde, wer kümmert sich um die Übertragung via SCK? Wird das 
über einen Bypass erledigt oder muss die MCU direkt ran?
Ich will, dass die MCU so wenig wie nötig mit der SPI Sache belastet 
wird, denn dann bleiben andere Anwendungen in der Zeit der Übertragung 
hinterher.

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Nullpainter (Gast)

31.07.2007 21:29

Lesenswert?

•

▲
▼

Nein, das macht ein Zaehler. Nach 8 takten ist das register leer. Dann 
wird ein Intterrupt ausgeloest, falls zugelassen

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

31.07.2007 21:45

Lesenswert?

•

▲
▼

> das Byte in das SPI-Register
>geschrieben wurde, wer kümmert sich um die Übertragung via SCK?

Hä? Was?

Du solltest dir zuerst mal in aller Ruhe eine SPI Verbindung in einem 
Datenblatt ansehen. Wie ist das verschaltet, was passiert dort, was muss 
die Software machen..

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

31.07.2007 22:00

Lesenswert?

•

▲
▼

ich kenn SPI.
Nur wollte ich mal weiter ins Detail.

Aber es scheint als wenn nach Setzen des TxReq-Bit sich die CPU von der 
Sache abwenden kann und anderes machen kann. Bis eben ein INT auftritt.
Oder mann wartet nach Start der Übertragung im Poll-Verfahren auf 
SPIF-Bit.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Bernd R. (Firma: Promaxx.net) (bigwumpus)

31.07.2007 22:24

Lesenswert?

•

▲
▼

...das unterscheidet einen Microcontroller von einem schnöden 
Microprozessor.
Der uController hat auch Funktionsgruppen in Hardware drin, die 
bestimmte Aufgaben autonom erledigen...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Nullpainter (Gast)

31.07.2007 22:24

Lesenswert?

•

▲
▼

SPI kennen, heisst das Detail kennen. Interrupts lohnen sich bei den 
maximalen transferraten uebigens kaum. Bei Clk/2 vergehen 16 clocks, 
wenn man da in der interruptrouting etwas pusht und popt ist die Zeit 
auch schon um.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Simon K. (simon)

31.07.2007 22:28

Lesenswert?

•

▲
▼

Nullpainter wrote:
> Bei Clk/2 vergehen 16 clocks,

Ich hab mal irgendwo gelesen, dass es genaugenommen 18 Clocks sind, bis 
das nächste Byte wieder ins Register geladen werden darf.

Trotz allem geb ich dir Recht ;) Ich hab auch bei meinen 
SD-Karten-Fullspeed-sources (Clk/2) keine Interruptgesteuerte SPI 
Schnittstelle. Das lohnt sich einfach nicht. Die paar takte kann man 
eben auch warten.

Absolut gesehen sind das bei 20MHz weniger als eine µS.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

31.07.2007 22:47

Lesenswert?

•

▲
▼

Bei mir hat die Zeitbetrachtung folgenden Grund:

Ich sende dem ENC28J60-Baustein über SPI @ 8MHz genau 122 Byte 
Stack-Daten. (42+80 UDP)

Bei dieser SPI-Geschwindigkeit wird also 1 MegaByte/s übertragen. Oder 
anders: 1 Byte/µs
Auf meine 122 Byte wären das dann 122µs an Zeit die vergehe würde, bis 
der Datenstrom im ENC ist.

Am Oszi mess ich aber: 380µs.
Ist der Rest alles Warte-Zeit?
Ich hab schon überlegt via DMA die Daten in das SPI-Register zu 
schieben. Ich weis nicht ob das Abhilfe schafft.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Philipp B. (philipp_burch)

31.07.2007 22:52

Lesenswert?

•

▲
▼

Zeig' doch mal den Code, wie du die Daten reinschaufelst. 1 MiB/s 
erreichst du natürlich nur, wenn das SPI im Dauerbetrieb taktet und das 
ist ja nicht möglich. Das Register zu laden benötigt ja auch etwas Zeit. 
Mehr als das Dreifache der Zeit ist allerdings schon etwas extrem.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

31.07.2007 22:59

Lesenswert?

•

▲
▼

Das beste ist, du guckst dir während der Übertragung die SCK Leitung auf 
nem Oszi an. Am besten als Triggerung den Beginn (oder kurz vorher) der 
Übertragung des ersten Bytes. zB mit CS=Low, oder per extra Pin.
Dort siehst du sofort, wie "effektiv" deine Übertragung ist. Also wie 
groß die Pausen zwischen den Bytes sind... Somit siehst du, obs am 
Programm zwischen den ausgaben (zB Daten aus RAM.. holen) liegt, oder 
obs am Programmeinsprung.. liegt...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Nailpainter (Gast)

31.07.2007 23:26

Lesenswert?

•

▲
▼

Wenn man's nicht in ASM macht kann schon was an Zeit verplemepert 
werden. Wenn mn zB Wartet bis das SPI fertig ist, und dann erst das byte 
holengeht, mit Arrayindexrechnung und so, ist einiges moeglich. Ich 
wuerd diesen Ladeprozess mal im simulator laufen lassen, oder falls das 
nicht geht, am Objekt selbst mit einem puls an einem Debugpin jeweils.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Falk B. (falk)

01.08.2007 08:57

Lesenswert?

•

▲
▼

@ Horst (Gast)

>Aber es scheint als wenn nach Setzen des TxReq-Bit sich die CPU von der
>Sache abwenden kann und anderes machen kann. Bis eben ein INT auftritt.

Ja. Das Generieren von SCK und rausschieben der Bits macht das SPI-Modul 
allein.

>Oder mann wartet nach Start der Übertragung im Poll-Verfahren auf
>SPIF-Bit.

Genau. Sinnvollereise wird man erst dan nächste Datenbyte laden und dann 
pollen.

MFG
Falk

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 17:08

Angehängte Dateien:

Bild3.png
540 KB

Lesenswert?

•

▲
▼

Hallo, so jetzt gehts weiter..

ich habe also mal das SCK Signal über den gesamten Vorgang aufgenommen.
Es ist also deutlich zu sehen: Lücken zwischen den Bytes.

90% der Daten sind mein Stack der übertragen wird. Die Funktion zum 
Schreiben des Stack ist die folgende:

void enc28j60WriteBuffer(uint16_t len, uint8_t* data)  // Länge (Byte), Startadresse Data
  // assert CS
  ENC28J60_CONTROL_PORT &= ~(1<<ENC28J60_CONTROL_CS);
  // issue write command
  SPDR = ENC28J60_WRITE_BUF_MEM;
  while(!(SPSR & (1<<SPIF)));
  while(len--)
    // write data
    SPDR = *data++;
    while(!(SPSR & (1<<SPIF)));  
  // release CS
  ENC28J60_CONTROL_PORT |= (1<<ENC28J60_CONTROL_CS);


Der Code ist vielermals im Netz zu finden, ich habe den eben auch 
genommen. Die Daten werden per Zeiger  zugewiesen, was doch schon sehr 
zügig sein sollte.

Hier konnte ich dann mit einem Debug-Pin die Wartezeiten feststellen.

Für das erste Bild gilt:

  while(len--)
    // write data
    SPDR = *data++;
    PORTC = 1;
    while(!(SPSR & (1<<SPIF)));  
                PORTC = 0;

Hier ist also die Poll-Zeit des SPIF-Bit aufgezeichnet.

Für das zweite Bild:

  while(len--)
    // write data
    PORTC = 1;
    SPDR = *data++;
    PORTC = 0;
    while(!(SPSR & (1<<SPIF)));  

Hier also das Schreiben eines Bytes in das SPI Register. Aber wieso 
inklusive SCK-Taktung?


Ich denke mal die Warte-Zeit auf das SPIF kann ich nicht verringern. 
Beim Transferieren der Daten in das SPI-Datenregister jedoch müsste doch 
was machbar sein. Evtl. DMA?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

01.08.2007 17:11

Lesenswert?

•

▲
▼

Was ist denn auf dem Bild zusehen??
Was ist oben, was unten??

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 17:14

Lesenswert?

•

▲
▼

Die COdes wurden wohl nicht korrekt übertragen. Nochmal:

Das PORTC-Bit0 ist der Debug Pin.

Für das erste Bild gilt:

while(len--)
// write data
SPDR = *data++;
PORTC = 1;
while(!(SPSR & (1<<SPIF)));  
PORTC = 0;



Für das zweite Bild:

while(len--)
// write data
PORTC = 1;
SPDR = *data++;
PORTC = 0;
while(!(SPSR & (1<<SPIF)));  

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Simon K. (simon)

01.08.2007 17:14

Lesenswert?

•

▲
▼

Horst wrote:
> Ich denke mal die Warte-Zeit auf das SPIF kann ich nicht verringern.
> Beim Transferieren der Daten in das SPI-Datenregister jedoch müsste doch
> was machbar sein. Evtl. DMA?

Hm, auf welcher Optimierungsstufe ist das kompiliert? Hast du eventuell 
mal Assembler-code von der Write-Funktion? Komisch, dass das laden und 
inkrementieren so "lange" braucht. Wobei das so lange ja garnicht ist ;)

Wenn ich mich nicht irre handelt es sich doch um einen 8-Bit AVR, die 
haben doch garkeine DMA Unterstützung.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 17:16

Lesenswert?

•

▲
▼

richtig, dort gibts kein DMA.

Der AVR dient nur zum Testen. EIgentlich läuft der Code auf einem 
Fujitsu 32-Bit.

Dort sieht das aber alles sehr ähnlich aus.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Falk B. (falk)

01.08.2007 17:18

Lesenswert?

•

▲
▼

@ Horst (Gast)

>ich habe also mal das SCK Signal über den gesamten Vorgang aufgenommen.
>Es ist also deutlich zu sehen: Lücken zwischen den Bytes.

Yep.

>void enc28j60WriteBuffer(uint16_t len, uint8_t* data)  // Länge (Byte), 
Startadresse Data
>{
>  // assert CS
>  ENC28J60_CONTROL_PORT &= ~(1<<ENC28J60_CONTROL_CS);
>  // issue write command
>  SPDR = ENC28J60_WRITE_BUF_MEM;
>  while(!(SPSR & (1<<SPIF)));
>  while(len--)
>  {
>    // write data
>    SPDR = *data++;
>    while(!(SPSR & (1<<SPIF)));
>  }
>  // release CS
>  ENC28J60_CONTROL_PORT |= (1<<ENC28J60_CONTROL_CS);
>}

>Der Code ist vielermals im Netz zu finden, ich habe den eben auch
>genommen. Die Daten werden per Zeiger  zugewiesen, was doch schon sehr
>zügig sein sollte.

Naja, hier wird man wohl um Assembler nicht rumkommen. Der Trick ist, 
während die alte Übertragung läuft schon die neuen Daten zu holen. In C 
ist es nicht sehr einfach zu garantieren, dass der Compiler das nicht in 
die flasche Richtung optimiert.

Versuch mal das.

void enc28j60WriteBuffer(uint16_t len, uint8_t* data)  // Länge (Byte), 
Startadresse Data
{
  uint8_t tmp;

  // assert CS
  ENC28J60_CONTROL_PORT &= ~(1<<ENC28J60_CONTROL_CS);
  // issue write command
  SPDR = ENC28J60_WRITE_BUF_MEM;
  while(!(SPSR & (1<<SPIF)));
  while(len--)
  {
    // write data
  tmp = *data++;
  while(!(SPSR & (1<<SPIF)));
    SPDR = tmp;
  }
  // release CS
  ENC28J60_CONTROL_PORT |= (1<<ENC28J60_CONTROL_CS);
}

>Ich denke mal die Warte-Zeit auf das SPIF kann ich nicht verringern.

Kaum, das SPI-Interface muss ja die Daten erstmal übertragen, bevor neue 
reingeschrieben werden können.

>Beim Transferieren der Daten in das SPI-Datenregister jedoch müsste doch
>was machbar sein. Evtl. DMA?

Assembler + Knoff Hoff!

MFG
Falk

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 17:19

Lesenswert?

•

▲
▼

Die Optimierung ist noch nicht aktiv. -O0 No optimization

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von déjà vu (Gast)

01.08.2007 17:39

Lesenswert?

•

▲
▼

Beitrag "SPI Codetuning"
http://www.matuschek.net/atmega-spi

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 17:54

Lesenswert?

•

▲
▼

interessante Links! Danke

mit einer Optimierung O1 konnte ich eben 40% Zeitersparnis erreichen :-)
DIe anderen Optimierungen brachten dann nichts mehr.

@Falk, guter Tipp. Aber erscheint dann am while zu hängen da die 
Bedingung bein ersten Mal wohl nicht erfpllt ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Simon K. (simon)

01.08.2007 17:56

Lesenswert?

•

▲
▼

Hast nochmal nen Oszillogramm? :-)
PS: Assembler-code wäre vielleicht auch nicht uninteressant.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

01.08.2007 18:04

Lesenswert?

•

▲
▼

Mir ist es mal gelungen, 24Bytes innerhalb einer ext. Int. ISR 
herauszutakten. Das ganze hat für den kompletten Aufruf(einsprung+push), 
Bearbung und Beenden(pop) etwa 35Mikrosekunden gedauert. Das Ganze auf 
nem mega128@16MHz.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 18:06

Angehängte Dateien:

optimierung.zip (1,91 KB)

Lesenswert?

•

▲
▼

jo kommt...

hier schon mal die Optimierungen im Vergleich: o0 und o1

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 19:12

Lesenswert?

•

▲
▼

hab mal diesen Code
Beitrag "Re: SPI Codetuning"

benutzt, und Optimierung Stufe 1 eingestellt.

Da wurden die 122 Byte in 152µs übertragen. (1,2µs pro Byte)
Das ist doch schon eine Steigerung.
Die Lücken sind auch deutlich kleiner.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von hackklotz (Gast)

01.08.2007 19:18

Lesenswert?

•

▲
▼

>uint16_t len

Brauchst du da wirklich 16 Bit für die Variable?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von D. W. (dave)

01.08.2007 19:24

Lesenswert?

•

▲
▼

Die Frage ist, ob man überhaupt Pollen sollte...

while(!(SPSR & (1<<SPIF)));
 17c:  77 9b         sbis  0x0e, 7
 17e:  fe cf         rjmp  .-4

Oben drüber ist das "out". Wenn ich richtig gezählt habe, dann fällt der 
16. Takt danach direkt auf das sbis.
Da erst mit dem 17. Takt die Transmission beendet ist, wird nicht 
übersprungen und der rjmp wird ausgeführt. Dann dauert es nochmal 4 
Takte, bis man aus der Schleife draußen ist, da rjmp=2 + aktives_sbis=2.

Wenn man jedoch einfach 16 Takte durch nops verliert (oder 
Platzsparender rjmp +0), dann wäre man eigentlich genau richtig im 
Timing.

Die zweite Frage ist, ob das auch so hinhaut. Hat das jemand mal 
ausprobiert oder willst du das mal ausprobieren Horst?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Nailpainter (Gast)

01.08.2007 19:34

Lesenswert?

•

▲
▼

Ja, sowas macht man vorteilhafter mit inline-ASM

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Horst (Gast)

01.08.2007 19:50

Lesenswert?

•

▲
▼

@Dave

du wolltest bestimmt nen anderen Ausschnitt zeigen, den deiner ist 
uninteresant.
Alles in der while muss betrachtet werden.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

01.08.2007 19:53

Lesenswert?

•

▲
▼

>Die zweite Frage ist, ob das auch so hinhaut. Hat das jemand mal
>ausprobiert oder willst du das mal ausprobieren Horst?

Ja, hab ich. das geht.
Hab aber statt der nops immer einen temp.ausgabepuffer geladen und 
andere dinge gemacht. und das ganze komplett ohne schleife..

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Falk (Gast)

01.08.2007 21:10

Lesenswert?

•

▲
▼

@ Matthias L. (lippy)

>Hab aber statt der nops immer einen temp.ausgabepuffer geladen und
>andere dinge gemacht. und das ganze komplett ohne schleife..

Ohne Schleife? Wie willst du da variable Datenblöcke übertragen?

MfG
Falk

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Prozessorauslastung bei SPI

von Matthias L. (Gast)

01.08.2007 21:19

Lesenswert?

•

▲
▼

>>illst du da variable Datenblöcke

Bei meinen Programm ging es immer um exakt 24Datenbytes.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: Mikrocontroller und Digitale Elektronik Prozessorauslastung bei SPI