Forum: Compiler & IDEs winavr linkerscript .bss vor .data und an konst. Adresse


von Holger M. (qibono)


Lesenswert?

Hallo,

ich habe ein Problem mit dem Linker (winavr-2010010). Kommt mir 
eigentlich ganz einfach vor, ich bin aber wohl zu blöd die richtige 
google Formel zu finden bzw. die ld-Doku zu verstehen.


Das .bss Segment (00 initialisierte Variablen) muss an eine konstante 
Adresse (den Anfang vom RAM).

Das .data Segment soll dahinter liegen. Im ursprüngliche Script von 
ATMEL war das anders herum.

Der Grund fuer den Aufstand: Das Programm soll Programmteile des 
Bootloaders verwenden (d.h. Codeteile aus zwei verschiedenen Hex-Files 
arbeiten zusammen). Beide Programmteile müssen Wissen über gemeinsam 
genutzte Variablen teilen. Ich muss also für die Variablen des 
Bootloaders im eigentlichen Programm Platz reservieren (ausserdem sollen 
sie beim Programmstart auf 00 initialisiert werden). Diese Variable habe 
ich in einem Assemblerfile in einem Segment .absasmdata angelegt, das 
ich an den Anfang der .bss Section und die wiederum an den Anfang des 
data-Bereichs    linken möchte (also Adresse 0x100 bzw. 0x8000100 für 
den Linker).
1
  .section .absasmdata, "", @nobits
2
3
  .global FAST_TICKER_L
4
FAST_TICKER_L: 
5
  .space 1
6
7
  ...

Die .data-Variablen (mit Konstanten initialisierte Variablen) sollen 
dann hinter dem .bss Segment landen.
1
// main.c
2
int const_4321 = 0x4321;


Unten folgt ein Ausschnitt aus meinem Linkerscript. Die Kommentare vor 
.data zeigen einen winzigen Teil meiner kläglich gescheiterten Versuche.
Entweder bricht der Linker mit einem Fehler ab oder aber er linkt .bss 
und .data beide auf Adresse 0x100. Letzteres führt dann dazu, dass 
const_4321 an der selben Speicherstelle (0x100 bzw. 0x800100) landet, 
wie meine FAST_TICKER_L Variable aus dem .bss-Segment.

Wer kennt das "Linker oeffne Dich" zu diesem Problem?

1
MEMORY
2
{
3
  text    (rx)  : ORIGIN = 0x000000, LENGTH = 0xEC00
4
  data    (rw!x)  : ORIGIN = 0x800100, LENGTH = 4k
5
  eeprom    (rw!x)  : ORIGIN = 0x810000, LENGTH = 2K
6
  fuse    (rw!x)  : ORIGIN = 0x820000, LENGTH = 3
7
  lock    (rw!x)  : ORIGIN = 0x830000, LENGTH = 1
8
  signature  (rw!x)  : ORIGIN = 0x840000, LENGTH = 1K
9
}
10
...
11
12
  bss :
13
  {
14
    PROVIDE (__bss_start = .);
15
    *(.absasmdata)
16
    *(.bss)
17
    *(.bss*)
18
    *(COMMON)
19
    PROVIDE (__bss_end = .);
20
  }> data
21
  __bss_data_end = (ADDR(.bss) + SIZEOF(.bss));
22
23
  /* .data wird mit Konstanten initialisiert */
24
  /* .data ADDR (.bss) + SIZEOF (.bss) : AT (ADDR (.text) + SIZEOF (.text))   */
25
  /* .data (ADDR(.bss) + SIZEOF(.bss)) : AT (ADDR (.text) + SIZEOF (.text))   */
26
  .data AT( __bss_data_end ) : AT (ADDR (.text) + SIZEOF (.text))
27
  {
28
    PROVIDE (__data_start = .);
29
    *(.data)
30
    *(.data*)
31
    *(.rodata) /* We need to include .rodata here if gcc is used */
32
    *(.rodata*) /* with -fdata-sections.  */
33
    *(.gnu.linkonce.d*)
34
    . = ALIGN(2);
35
    _edata = .;
36
    PROVIDE (__data_end = .);
37
  }> data

von Stefan E. (sternst)


Lesenswert?

Holger M. schrieb:
> Der Grund fuer den Aufstand: Das Programm soll Programmteile des
> Bootloaders verwenden (d.h. Codeteile aus zwei verschiedenen Hex-Files
> arbeiten zusammen). Beide Programmteile müssen Wissen über gemeinsam
> genutzte Variablen teilen.

Dann lass dieses Bootloader-Programmteil (ja wohl eine oder mehrere 
Funktionen, oder?) nicht einfach auf irgendwelche globalen Variablen 
zugreifen, sondern gib der Funktion einen (oder mehrere) Pointer mit.

von Holger M. (qibono)


Lesenswert?

@Stefan Ernst
Ist keine Option. Sinn der Veranstaltung ist Code-Speicher zu sparen. 
Das Pointer laden und -Lookup würde mehr Code brauchen als ich sparen 
kann.

Holger

von Stefan E. (sternst)


Lesenswert?

Holger M. schrieb:
> Das Pointer laden und -Lookup würde mehr Code brauchen als ich sparen
> kann.

Glaube ich dir nicht ungesehen. Wenn es bei den gemeinsamen Daten um 
einen größeren Datenblock geht (z.B. ein Array) wird in der aufgerufenen 
Funktion ja sowieso ein Pointer darauf erzeugt werden. Und wenn es um 
mehrere unterschiedliche Variablen geht, könnte man sie zu einer struct 
zusammenfassen, und einen Pointer darauf übergeben. Das könnte eventuell 
sogar kürzeren Code ergeben, als das Laden der ganzen Variablen von 
festen Adressen.

von Holger M. (qibono)


Lesenswert?

Ich glaube ich habe eine Antwort auf mein Problem gefunden; vieleicht 
hilft sie ja irgendwann einmal jemandem.

Das ursprüngliche Linkerscript geht wohl auf ein Beispiel von ATMEL 
zurück. Ich vermute deswegen, dass es bei vielen Leuten ähnlich aussehen 
wird.

Meine Vermutung ist, dass der Name ".data" etwas überstrapaziert wurde. 
Einmal ausserhalb der geschweiften Klammenr als Unterbereich von "data" 
und dann innerhalb der geschweiften Klammern als Segmentname (vom gcc 
vorgegeben). Wenn beide .data-Bereiche auf Offset 0000 innerhalb ihres 
jeweiligen Bereichs liegen, fällt diese Mehrdeutigkeit nicht auf - genau 
das wollte ich aber ja ändern. Ob das vielleicht sogar eine 
Schwachstelle vom Linker ist, interessiert mich hier im Moment nicht. 
Ich finde es ohnehin eklig, verschiedene Dinge identisch zu bezeichnen.

Zur Lösung habe ich also die Subsection .data in .initializedram 
umbenannt und weil ich gerade dabei war und es mit .bss die gleiche 
Mehrdeutigkeit gab, habe ich auch .bss in .zeroedram umbenannt. Danach 
sieht mein MAP-File so aus, wie ich es erwartet habe.

Die Labels __data_load_start, __data_load_end müssen auch noch 
entsprechend angepasst werden damit die Konstanteninitialisierung 
funktioniert.
1
MEMORY
2
{
3
  text    (rx)  : ORIGIN = 0x000000, LENGTH = 0xEC00
4
  data    (rw!x)  : ORIGIN = 0x800100, LENGTH = 4k
5
  eeprom    (rw!x)  : ORIGIN = 0x810000, LENGTH = 2K
6
  fuse    (rw!x)  : ORIGIN = 0x820000, LENGTH = 3
7
  lock    (rw!x)  : ORIGIN = 0x830000, LENGTH = 1
8
  signature  (rw!x)  : ORIGIN = 0x840000, LENGTH = 1K
9
}
10
11
  .zeroedram :
12
  {
13
    PROVIDE (__bss_start = .);
14
    *(.absasmdata)
15
    *(.bss)
16
    *(.bss*)
17
    *(COMMON)
18
    PROVIDE (__bss_end = .);
19
  }> data
20
21
  .initializedram : AT (ADDR (.text) + SIZEOF (.text)) 
22
  {
23
    PROVIDE (__data_start = .);
24
    *(.data)
25
    *(.data*)
26
    *(.rodata) /* We need to include .rodata here if gcc is used */
27
    *(.rodata*) /* with -fdata-sections.  */
28
    *(.gnu.linkonce.d*)
29
    . = ALIGN(2); 
30
    _edata = .;  
31
    PROVIDE (__data_end = .);
32
  }> data
33
  __data_load_start = LOADADDR(.initializedram);
34
  __data_load_end = __data_load_start + SIZEOF(.initializedram);

Ich habe diese Änderungen bisher nicht auf Seiteneffekte auf Simulator, 
Programmiertools etc. überprüft. Wenn jemand dazu Informationen (oder 
eine fundierte Meinung) hat, nehme ich diese gern zur Kentniss

Holger

von Flo (Gast)


Lesenswert?

Hallo Holger!

1
Ich glaube ich habe eine Antwort auf mein Problem gefunden; vieleicht 
2
hilft sie ja irgendwann einmal jemandem.

Und ob! ;)
Ich habe auch eine etwas unübliche Bootloaderkonstruktion gebaut, die 
kein UART implementiert, sondern nur als Ausführ-Ort für das SPM 
Kommando dient. Die Anwendungen selbst rufen den Bootloader auf. Um 
Bootloader und Images trotzdem die Möglichkeit zu geben, schreiben zu 
können (und der Ram sehr begrenzt ist >.<) , habe ich nach einer 
sauberen Lösung für gemeinsam bekannten Puffer im Ram gesucht.
Nach studenlangem Einlesen ins GNU-LD Handbuch, hab ich meine 
Wunschkonstellation wie du ewig nicht hingekriegt. Und exakt der Tip mit 
den eigenartig identischen Symbol/Section-Namen hat die gewünschte 
Symbolverteilung gebracht!

Ich hätte bei
1
.bss   : AT ( ADDR (.bss) ) { .. }
aber auch schon stutzig werden müssen ;).

Jedoch wird ein Hex-File erzeugt, bei dem explizit ein Adress-Sprung auf 
0x0080 drin ist (Intel-Hex Zeile vom Typ 04). Der avr-dude sagt mir da, 
dass er die Adresse nicht gefunden hat (so einen großen Flash hat der 
avr nun mal nicht ;). Im Avr wird die Adresse 0x0080.xxxx offenbar nicht 
verwertet und an den SRAM weitergeleitet (wäre ja auch eine 32bit 
Adresse).
Das was wir wollen, ist ja, dass der Linker zur Compile-Zeit allen 
Variablen die richtige Adresse zurordnet.

Avr-Dude kann soweit ich das verstanden habe, keinen Ram direkt 
schreiben. Der wird ja sowieso beim Reset mit den initialisierten 
Datenwerten geladen (__data_load_start .. __data_load_end).
Ich hab gerade nochmal probiert, eeprom-Werte mit reinzukompilieren. Da 
passiert dasselbe...
Avr-Dude erkennt folgende Intel-Hex Zeile als ungültig an:
1
:02000004008179
2
:04000000FEA4AFFEAD
 --> also vom Typ 04, und Adresse 0x0081 als obere 16bit für die 
folgenden Zeilen. Das korreliert mit dieser Zeile aus dem Linkerscript:
1
eeprom (rw!x) : ORIGIN = 0x810000, LENGTH = 64K
(zugehöriger Code: uint8_t eeFooByteArray4[] EEMEM = { 0xFE, 0xA4, 
0xAF,0xFE }; )

Wenn man mit Avr-Dude den eeprom schreiben will, braucht man eine andere 
Kommandozeile (eeprom:w:e.hex) ... Offenbar scheint das Schreiben in 
verschiedene Speicher mit verschiedenen SPI-Schreib-Befehlen codiert zu 
sein.

Die Lösung des Problems war im Endeffekt, dass man eine globale Variable 
anlegt (Position egal) und sie mit einer eigenen Section-Anweisung 
versieht.
1
uint8_t globalBuf[128] __attribute__ (( section(".globalBufSec")));
Im Linkerscript wird eine Zeile eingfügt, dass vor den .data Sections 
aller Dateien, die eigenen Sections zu stehen haben.
1
  
2
  .data : AT( ADDR (.text) + SIZEOF(.text) ) 
3
  {
4
  /* hier werden SYMBOLE definiert! */  
5
     PROVIDE (__data_start = .) ; /* The PROVIDE keyword may be used to define a symbol, such as `etext', only if it is referenced but not defined. */
6
  
7
  *(.globalBufSec) /*eigene sections*/
8
  
9
    
10
  *(.data)
11
      *(.data*)
12
      *(.rodata)  /* We need to include .rodata here if gcc is used */
13
      *(.rodata*) /* with -fdata-sections.  */
14
      *(.gnu.linkonce.d*)
15
    
16
      . = ALIGN(2); /* Linker location counter auf relativen Offset von 2 ggü Start der Section,
17
          dieser Wert gilt *MINDESTENS* --> wenn data-variablen: "_edata" direkt danach*/
18
  _edata = . ; /* SYMBOL: end data */    
19
  PROVIDE (__data_end = .) ;     
20
  }  > data

Wenn man die .data und .bss Blöcke umbenennt, gibt es mit hoher 
Wahrscheinlichkeit einen Fehler!! Zwar meckert weder avr-gcc noch 
avr-dude, aaaber:
Aus dem Datenblatt:
1
Data Memory Map for ATmega164P/324P/644P.
2
32 Registers    ...  0x0000 - 0x001F
3
64 I/O Registers  ...  0x0020 - 0x005F
4
160 Ext I/O Reg.  ...  0x0060 - 0x00FF
5
Internal SRAM    ...  0x0100 - 0x04FF/0x08FF/0x10FF
Wenn man .data in .dataOut ändert (also den Block innerhalb von 
SECTIONS{..}), starten die zugehörigen Daten bei 0x0080.0060 
(entsprechend der Definition im Linkerscript von "data" in MEMORY. siehe 
avr-objdump [..].elf -x). Und genau das ist tödlich beim atmega164!
Somit werden nämlich die "Externen I/O Register" überschrieben und nicht 
der SRAM benutzt!

Zum Schluss habe ich noch kurz gesucht, was die ganze Toolchain dazu 
bewogen hat ".data" anders als ".dataOut" (ausgedachter Name) zu 
behandeln und den Inhalt einfach so auf 0x0080.0100 zu schieben:
In /usr/lib/avr/include/avr gibt es eine Menge config-Dateien, die wohl 
vom avr-gcc je nach Auswahl des Controllers (-mmcu=..) geladen werden.
Dort steht zb "#define RAMSTART (0x100)" drin, was intern mit der 
Ausgabe-Section ".data" des Linker-Scripts verknüpft sein muss. 
(gefunden mit: grep "x100" -r /usr/lib/avr/* )

Soviel dazu ... ;)

Viele Grüße
Flo

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.