Forum: Compiler & IDEs strlen(.) oder sizeof(.)-1


von Jochen (Gast)


Lesenswert?

Hallo!

Was ist denn besser?
1
#define MY_STRING  "Das ist ein Test"
2
3
...
4
{
5
  uint8 len;
6
  /* Option 1 */
7
  len = strlen(MY_STRING);
8
  /* Option 2 */
9
  len = sizeof(MY_STRING)-1;
10
}


Danke & Gruß
Jochen

: Verschoben durch User
von Peter II (Gast)


Lesenswert?

Jochen schrieb:
> Was ist denn besser?

ordentlicher ist strlen, schneller ist sizeof

von Frank M. (ukw) (Moderator) Benutzerseite


Lesenswert?

Peter II schrieb:
> ordentlicher ist strlen, schneller ist sizeof

Kommt darauf an, ob strlen() eine externe Funktion ist oder "builtin" 
ist.

Der gcc generiert jedenfalls für beide Varianten denselben Code.

von Rolf M. (rmagnus)


Lesenswert?

Peter II schrieb:
> ordentlicher ist strlen, schneller ist sizeof

In diesem speziellen Fall sind sie typischerweise gleichwertig.
Wenn man es allgemeiner betrachtet, muss man beachten, dass sizeof nur 
mit konstanten Arrays das gewünschte Ergebnis bringt, während strlen 
ganz allgemein mit Strings funktioniert, dafür aber (sofern der Inhalt 
dem Compiler nicht schon bekannt ist) zur Laufzeit durch den String 
iterieren muss und daher mehr Zeit braucht.

von Jochen (Gast)


Lesenswert?

Peter II schrieb:
> ordentlicher ist strlen, schneller ist sizeof

Habe ich vermutet, da der Compiler vermutlich schon das sizeof()-1 
ausrechnet und als festen Wert in den Code einträgt.

Das wird vermutlich auch bei
1
#define MY_STRING  "Das ist ein Test"
2
3
char testString[] = MY_STRING;
4
...
5
{
6
  uint8 len;
7
  /* Option 1 */
8
  len = strlen(MY_STRING);
9
  /* Option 2 */
10
  len = sizeof(MY_STRING)-1;
11
}

gelten, so lange man den Inhalt von testString nicht ändert.

Wenn ich das hier mache:
1
#define MY_STRING  "Das ist ein Test"
2
3
char testString[] = MY_STRING;
4
...
5
{
6
  uint8 len;
7
  
8
  testString[4] = 0;
9
  /* Option 1 */
10
  len = strlen(MY_STRING);
11
  /* Option 2 */
12
  len = sizeof(MY_STRING)-1;
13
}
Bekomme ich bei Option 1 logsicherweise dann 3 und Option2 weiterhin 
(konstant) 16.

Oder?

von Frank M. (ukw) (Moderator) Benutzerseite


Lesenswert?

Jochen schrieb:
> Peter II schrieb:
>> ordentlicher ist strlen, schneller ist sizeof
>
> Habe ich vermutet, da der Compiler vermutlich schon das sizeof()-1
> ausrechnet und als festen Wert in den Code einträgt.

Ja, natürlich wird sizeof() immer zur Compilezeit ermittelt. Aber in 
Deinem konkreten Fall, wo es sich um eine Zeichenkonstante handelt, die 
zur Compilezeit bekannt ist, ersetzt der Compiler den Aufruf von 
strlen() direkt durch die Konstante.

Beweis:
1
#define MY_STRING  "Das ist ein Test"
2
3
int
4
main ()
5
{
6
    uint8_t len;
7
8
    len = strlen(MY_STRING);
9
//  len = sizeof(MY_STRING)-1;
10
11
    PORTD = len;   // damit das Ergebnis nicht wegoptimiert wird
12
}

Output:
1
00000080 <main>:
2
  80:  80 e1         ldi  r24, 0x10  ; 16
3
  82:  8b b9         out  0x0b, r24  ; 11
4
  84:  80 e0         ldi  r24, 0x00  ; 0
5
  86:  90 e0         ldi  r25, 0x00  ; 0
6
  88:  08 95         ret

Hier wird PORTD einfach mit 16 geladen. Das ist derselbe Code wie bei 
der sizeof-Variante.

: Bearbeitet durch Moderator
von Daniel A. (daniel-a)


Lesenswert?

Sowas kann auch praktisch werden:
1
#include <stdio.h>
2
#define CS(X) (const string){ .ptr=X, .length=sizeof(X)-1 }
3
4
typedef struct {
5
  char* ptr;
6
  size_t length;
7
} string;
8
9
int main( void ){
10
  const string s = CS("Test");
11
  printf("%zu: ",s.length);
12
  fwrite(s.ptr,1,s.length,stdout);
13
  putchar('\n');
14
  return 0;
15
}

von Markus F. (mfro)


Lesenswert?

und jetzt die Preisfrage: was passiert bei
1
#define MY_STRING  "Das ist ein Test\0und nochwas"

???

von Georg G. (df2au)


Lesenswert?

Markus F. schrieb:
> ???

sizeof() liefert die gesamte Länge, strlen() liefert die Länge bis zur 
ersten 0x00. Woher soll das Programm zur Laufzeit auch wissen, dass der 
Programmierer da höheren Schwachsinn geschrieben hat.

von Frank M. (ukw) (Moderator) Benutzerseite


Lesenswert?

Markus F. schrieb:
> und jetzt die Preisfrage: was passiert bei
> #define MY_STRING  "Das ist ein Test\0und nochwas"

strlen: 16
sizeof: 28

Beide Male setzt der Compiler einfach die Konstante in den 
Assembler-Code ein. strlen() wird also weiterhin nicht aufgerufen.

von Stefan F. (Gast)


Lesenswert?

Ich bin immer wieder begeistert, was der Compiler alles weg optimieren 
kann. Dass er strlen() durch eine Konstante ersetzen kann hätte ich gar 
nicth erwartet. Ein super Programm ist das, ich mag den gcc.

von Clemens L. (c_l)


Lesenswert?

Für den "Hallo, Welt"-Benchmark gibt es natürlich auch etwas: 
http://www.ciselant.de/projects/gcc_printf/gcc_printf.html

von Markus F. (mfro)


Lesenswert?

Georg G. schrieb:
> Markus F. schrieb:
>> ???
>
> sizeof() liefert die gesamte Länge, strlen() liefert die Länge bis zur
> ersten 0x00. Woher soll das Programm zur Laufzeit auch wissen, dass der
> Programmierer da höheren Schwachsinn geschrieben hat.

Das ist meiner Ansicht nach kein Schwachsinn (weder hoch noch tief) - 
ich verwende das beispielsweise für Texte, wenn ich nur zwei Sprachen 
brauche.

Wollte damit zeigen, daß sizeof() - 1 möglicherweise keine gute Idee als 
Ersatz für strlen() ist.

von Dergute W. (derguteweka)


Lesenswert?

Moin,

Wenn man mal noch lustigere Zeichen als simples ASCII nimmt, also 
irgendwelche UTF-irgendwas Dinger, wirds wohl auch Abweichungen zwischen 
strlen und sizeof geben.

Gruss
WK

von Dumdi D. (dumdidum)


Lesenswert?

strlen ist besser, da es ausdrückt was gemeint ist. sizeof()-1 dauert 3x 
länger zu verstehen (ausser natürlich in so kleinen Programmen). Wenn 
das Programm mal geändert wird auf char* , dann liefert sizeof einen 
falschen Wert.

von Dirk B. (dirkb2)


Lesenswert?

Stefan U. schrieb:
> Ich bin immer wieder begeistert, was der Compiler alles weg optimieren
> kann. Dass er strlen() durch eine Konstante ersetzen kann hätte ich gar
> nicth erwartet. Ein super Programm ist das, ich mag den gcc.

Der kann sogar die Funktionen aus math.h ersetzen, wenn man die mit 
Konstanten aufruft.

von Georg G. (df2au)


Lesenswert?

Markus F. schrieb:
> Wollte damit zeigen, daß sizeof() - 1 möglicherweise keine gute Idee als
> Ersatz für strlen() ist.

Genau das wollte ich auch sagen. Sizeof() wird nur zur Compile Zeit 
ausgewertet. Ich hätte erwartet, dass der Compiler bei einem String, der 
nicht als const definiert ist, das strlen() nicht als Funktion 
eliminiert. Im Gegensatz zu stefanus halte ich das für einen Fehler.

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

Georg G. schrieb:
> Im Gegensatz zu stefanus halte ich das für einen Fehler.

Wenn der Compiler keinen Weg sieht, wie der String etwas anderes
als konstant sein kann, darf er das, ansonsten natürlich nicht.

von Georg G. (df2au)


Lesenswert?

Zur Klarstellung:

Bei den Beispielen wurde der String immer mit #define str "tralala" 
definiert. Damit kann er zur Laufzeit nie verändert werden.

Definiert man ihn mit char str[] = "tralala", wird strlen() immer 
aufgerufen.

: Bearbeitet durch User
von Peter II (Gast)


Lesenswert?

Georg G. schrieb:
> Bei den Beispielen wurde der String immer mit #define str "tralala"
> definiert. Damit kann er zur Laufzeit nie verändert werden.
>
> Definiert man ihn mit char str[] = "tralala", wird strlen() immer
> aufgerufen.

das kann nicht sein.
Der Compiler sieht darin keinen Unterschied. der Preprozessor ersetzt ja 
schon die defines.

von Georg G. (df2au)


Lesenswert?

Peter II schrieb:
> das kann nicht sein.

Dann probier es aus.

char str0[] = "Hello World";
#define str1 "tralala"

int main(void) {

    char    i;

    i = strlen(str0);
    PORTA = i;

    i = strlen(str1);
    PORTA = i;

    return(0);
    }

ergibt

    i = strlen(str0);
  be:  e0 e0         ldi  r30, 0x00  ; 0
  c0:  f1 e0         ldi  r31, 0x01  ; 1
  c2:  01 90         ld  r0, Z+
  c4:  00 20         and  r0, r0
  c6:  e9 f7         brne  .-6        ; 0xc2 <main+0x4>
  c8:  31 97         sbiw  r30, 0x01  ; 1
  ca:  e0 50         subi  r30, 0x00  ; 0
  cc:  f1 40         sbci  r31, 0x01  ; 1
    PORTA = i;
  ce:  e2 b9         out  0x02, r30  ; 2

    i = strlen(str1) -1;
    PORTA = i;
  d0:  86 e0         ldi  r24, 0x06  ; 6
  d2:  82 b9         out  0x02, r24  ; 2

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

Georg G. schrieb:
> Dann probier es aus.
>
> char str0[] = "Hello World";

Hängt damit zusammen, dass str0 hier global sichtbar ist und daher
von anderen Modulen geändert werden könnte.

Mach es mal „static“.

von Georg G. (df2au)


Lesenswert?

Jörg W. schrieb:
> Mach es mal „static“.

Aber gern :-)

int main(void) {

static char str0[] = "Hello World";
    char    i;

    i = strlen(str0);
  be:  e0 e0         ldi  r30, 0x00  ; 0
  c0:  f1 e0         ldi  r31, 0x01  ; 1
  c2:  01 90         ld  r0, Z+
  c4:  00 20         and  r0, r0
  c6:  e9 f7         brne  .-6        ; 0xc2 <main+0x4>
  c8:  31 97         sbiw  r30, 0x01  ; 1
  ca:  e0 50         subi  r30, 0x00  ; 0
  cc:  f1 40         sbci  r31, 0x01  ; 1
    PORTA = i;
  ce:  e2 b9         out  0x02, r30  ; 2

Noch Fragen?

von Carl D. (jcw2)


Lesenswert?

Georg G. schrieb:
> Noch Fragen?

Welcher Compiler/Version?

von Georg G. (df2au)


Lesenswert?

Thread model: single
gcc version 4.7.2 (AVR_8_bit_GNU_Toolchain_3.4.2_939)

von 2⁵ (Gast)


Lesenswert?

Mach mal ein 'const' davor ;-)

von Carl D. (jcw2)


Lesenswert?

Geh mal auf 4.9 oder größer.
Nicht immer wurde mit neueren Versionen das AVR-Backend besser, aber der 
Compiler selbst hat massiv dazugelernt.
Ich verwende 6.2 und bin mir sicher, daß der keine Probleme hat, die 
Länge dieses faktisch konstanten Strings (statisch, nicht verändert) zur 
Compile-Time zu ermitteln.
Wobei, wenn man weiß, daß man ihn nicht ändern möchte, ein "const" um 
das zu dokumentieren nicht falsch ist.

Wenn ich das Päd. Wieder weggelegt hab, kann ich es ja mal testen.

: Bearbeitet durch User
von Markus F. (mfro)


Lesenswert?

Jörg W. schrieb:
> Georg G. schrieb:
>> Dann probier es aus.
>>
>> char str0[] = "Hello World";
>
> Hängt damit zusammen, dass str0 hier global sichtbar ist und daher
> von anderen Modulen geändert werden könnte.
>
> Mach es mal „static“.

das hat damit nichts zu tun.
1
char str0[] = "Hello World";   /* 1 */
2
char *str1 = "Hello World";    /* 2 */
3
#define str2 "Hello World"     /* 3 */

gcc legt str0 (veränderbar) im .data Segment ab. Str1 und str2 (wenn 
benutzt) werden als Literale im .text (oder .rodata) Segment abgelegt 
und sind damit per Definition unveränderbar. Ein const braucht's dazu 
nicht.

: Bearbeitet durch User
von Peter II (Gast)


Lesenswert?

Georg G. schrieb:
> Dann probier es aus.
>
> char str0[] = "Hello World";
> #define str1 "tralala"
> i = strlen(str1);

ok, ich bin von folgenden ausgegangen:
1
char str0[] = "Hello World";
2
i = strlen(str0);

oder
1
#define str1 "tralala"
2
char str0[] = str1
3
i = strlen(str0);

und das sollte immer das gleiche sein.

von Carl D. (jcw2)


Lesenswert?

Markus F. schrieb:
>
1
> char str0[] = "Hello World";   /* 1 */
2
> char *str1 = "Hello World";    /* 2 */
3
> #define str2 "Hello World"     /* 3 */
4
>
>
> gcc legt str0 (veränderbar) im .data Segment ab. Str1 und str2 (wenn
> benutzt) werden als Literale im .text (oder .rodata) Segment abgelegt
> und sind damit per Definition unveränderbar. Ein const braucht's dazu
> nicht.

Nicht so ein AVR-GCC, denn der muß mit 2 separaten Adressräumen umgehen 
und legt Texte nur dann in FLASH ab, wenn man ihn dazu zwingt.

von Andreas B. (andreas_b77)


Lesenswert?

Carl D. schrieb:
> Nicht so ein AVR-GCC, denn der muß mit 2 separaten Adressräumen umgehen
> und legt Texte nur dann in FLASH ab, wenn man ihn dazu zwingt.

String-Literale sind in C nicht beschreibbar. Auch wenn das auf dem AVR 
möglich ist, ist das Verhalten undefiniert wenn man das auch macht.

Damit kann der Compiler davon ausgehen, dass ein als Literal gegebener 
String sich zur Laufzeit nicht verändert und entsprechend optimieren. 
Ein extra const braucht es dafür nicht.

von Markus F. (mfro)


Lesenswert?

Andreas B. schrieb:
> String-Literale sind in C nicht beschreibbar. Auch wenn das auf dem AVR
> möglich ist, ist das Verhalten undefiniert wenn man das auch macht.

Früher gab's mal -fwritable-strings (wurde allerdings - 
vernünftigerweise - abgeschafft).

von Carl D. (jcw2)


Lesenswert?

Andreas B. schrieb:
> Carl D. schrieb:
>> Nicht so ein AVR-GCC, denn der muß mit 2 separaten Adressräumen umgehen
>> und legt Texte nur dann in FLASH ab, wenn man ihn dazu zwingt.
>
> String-Literale sind in C nicht beschreibbar. Auch wenn das auf dem AVR
> möglich ist, ist das Verhalten undefiniert wenn man das auch macht.
>
> Damit kann der Compiler davon ausgehen, dass ein als Literal gegebener
> String sich zur Laufzeit nicht verändert und entsprechend optimieren.
> Ein extra const braucht es dafür nicht.

Ich habe nichts von der Beschreibbarkeit von String-Konstanten 
geschrieben, sondern von der Tatsache, daß ein AVR mehrere Adressräume 
hat. Der Compiler kann eine String-Konstante nicht einfach in den 
FLASH-Bereich stecken, den ein solcher String hat keine Adresse im 
Adress-Raum, in dem ein char str[10] liegt.
Strings sind im RAM-Adress-Raum, const char Flash[] = "Flash" steht im 
FLASH-Adress-Raum.
Beide beginnen bei 0, auch wenn im RAM-Adress-Raum bis 0x60/0x100 
erstmal Register/Io kommt.
Es gibt spezielle Befehle, um auf Konstanten im FLASH zuzugreifen

Was braucht's noch, um den Unterschied zu einem ARM mit 4GB linearem 
Adress-Raum zu verstehen?

von Yalu X. (yalu) (Moderator)


Lesenswert?

Jörg W. schrieb:
> Georg G. schrieb:
>> Dann probier es aus.
>>
>> char str0[] = "Hello World";
>
> Hängt damit zusammen, dass str0 hier global sichtbar ist und daher
> von anderen Modulen geändert werden könnte.
>
> Mach es mal „static“.

Das ändert nichts, da str0 trotzdem hintenherum über Zeigerzugriffe
verändert werden könnte. Im vorliegenden Beispiel könnte der Compiler
diesen Fall zwar ausschließen, da das Programm nur aus einer einzigen
Funktion (main) besteht, in der keinerlei Zeigergewurschtel stattfindet.
In etwas kopmplexeren Programmen geht aber diese Sorte von Analyse um
zu viele Ecken und ist deswegen für den Compiler zu schwer.

Mit "const" sieht die Sache anders aus, da hiermit der Programmierer dem
Compiler zusichert, dass str0 nirgends im Programm geändert wird, auch
nicht über Zeigertricks.

Ebenfalls zur Compilezeit ausgewertet wird strlen in diesem Beispiel,
und das sogar ohne die Verwendung von "const":

1
int main(void) {
2
  char i;
3
  char str2[] = "Hello World";
4
5
  /*
6
  Hier kann beliebiger Code mit Ausnahme von
7
  - direkten Schreibzugriffen auf str2,
8
  - Schreibzugriffen über Zeiger und
9
  - Aufrufen externer Funktionen
10
  stehen.
11
  */
12
13
  i = strlen(str2);
14
  PORTA = i;
15
16
  return 0;
17
}

Hier kann der Compiler leicht sehen, dass zwischen der Definition von
str2 und dem strlen-Aufruf der String nicht verändert wird, so dass die
Optimierung angewendet kann.

Sobald aber anstelle des Kommentars eine Anweisung wie diese hier

1
  PORTA = 42;

steht, ist es vorbei mit der Optimierung, da die Zuweisung an PORTA ein
(etwas kaschierter) Zugriff über Zeiger ist, der (zumindest in den Augen
des Compilers) str2 überschreiben könnte. Deswegen wird hier strlen zur
Laufzeit und nicht zur Compilezeit ausgeführt.


Edit:

Macht man in diesem Beispiel str2 static, wird ebenfalls nicht mehr
optimiert. Das sich da Ganze in der main-Funktion abspielt, besteht
eigentlich keine Gefahr, dass str2 irgendwo überschreiben wird. Jedoch
behandelt GCC main wie jede andere C-Funktion. Und würde die Funktion im
Beispiel nicht main, sondern func heißen, könnte es tatsächlich sein,
dass vor dem Aufruf von func ein Stück Code ausgeführt wird, der über
abenteuerliche Zeigeroperationen str2 verändert.

: Bearbeitet durch Moderator
von Hans-Georg L. (h-g-l)


Lesenswert?

Georg G. schrieb:
>
> sizeof() liefert die gesamte Länge, strlen() liefert die Länge bis zur
> ersten 0x00. Woher soll das Programm zur Laufzeit auch wissen, dass der
> Programmierer da höheren Schwachsinn geschrieben hat.

Es ist durchaus in C üblich auf diese Weise stringlisten zu definieren.

Beispiel:
1
int main()
2
{
3
  char *list =  "text_1\0" \
4
      "text_2\0" \
5
      "text_3\0" \
6
      "text_4\0" \
7
      "\0";
8
9
  for (char*p = list; *p != 0; p += strlen(p) + 1)
10
  {
11
    printf("%s\r\n", p);    
12
  }
13
}

von Peter II (Gast)


Lesenswert?

Hans-Georg L. schrieb:
> Es ist durchaus in C üblich auf diese Weise stringlisten zu definieren.

wer macht so etwas wenn es Array gibt?

[c]
int main()
{
  char *list[] =  { "text_1", "text_2", "text_3", "text_4", 0 };

  int i = 0;
  while( list[i] != 0 )
  {
    printf("%s\r\n", list[i] );
  }
}

von Daniel A. (daniel-a)


Lesenswert?

Peter II schrieb:
> Hans-Georg L. schrieb:
>> Es ist durchaus in C üblich auf diese Weise stringlisten zu definieren.
>
> wer macht so etwas wenn es Array gibt?

Microsoft, natürlich! Beispiel: 
https://msdn.microsoft.com/en-us/library/ms683187(v=vs.85).aspx

von Markus F. (mfro)


Lesenswert?

Peter II schrieb:
> Hans-Georg L. schrieb:
>> Es ist durchaus in C üblich auf diese Weise stringlisten zu definieren.
>
> wer macht so etwas wenn es Array gibt?
>
> [c]
> int main()
> {
>   char *list[] =  { "text_1", "text_2", "text_3", "text_4", 0 };
>
>   int i = 0;
>   while( list[i] != 0 )
>   {
>     printf("%s\r\n", list[i] );
>   }
> }

Das ist was Anderes: ein Zeigerarray auf Stringliterale. Belegt für 
jeden der Texte nochmal einen Pointer. Bei deinem Beispiel und 32 
Bit-Zeigern also mal eben so rund 70% Overhead.
Kann man so machen (ich mach's - meist - auch so), aber wenn's eng wird, 
nicht unbedingt besser ...

von Jörg W. (dl8dtl) (Moderator) Benutzerseite


Lesenswert?

Daniel A. schrieb:
> Peter II schrieb:
>> Hans-Georg L. schrieb:
>>> Es ist durchaus in C üblich auf diese Weise stringlisten zu definieren.
>>
>> wer macht so etwas wenn es Array gibt?
>
> Microsoft, natürlich! Beispiel:
> https://msdn.microsoft.com/en-us/library/ms683187(v=vs.85).aspx

Environment-Variablen haben ja nun nichts in erster Linie mit
Microsoft zu tun.

Dass man diese erstmal nur linear im Speicher anordnen kann, ist
völlig logisch, denn sie kommen ja eben daher, was ihr Name sagt:
aus der Umgebung (des aufgerufenen Prozesses).  Dort liegen sie
einfach nur hintereinander in einem Stück Speicher.

Unter Unix baut der Startup-Code dann dafür noch ein Pointer-Array
(im Stack) auf, welches als dritter Parameter an main() übergeben
wird.  Dass die eigentlichen Strings im Speicher hintereinander liegen,
kann man sich aber im Debugger ansehen:
1
(gdb) p environ
2
$6 = (char **) 0x7fffffffe528
3
(gdb) p *environ
4
$7 = 0x7fffffffe823 "COLUMNS=151"
5
(gdb) p *(char *)0x7fffffffe823@100
6
$8 = "COLUMNS=151\000LINES=46\000XTERM_SHELL=/bin/tcsh\000TERMCAP=xterm|X11 terminal emulator:@7=\\EOF:@8=\\EOM:F1=\\E"

Markus F. schrieb:
> Kann man so machen (ich mach's - meist - auch so), aber wenn's eng wird,
> nicht unbedingt besser ...

Ist halt der übliche space/time tradeoff: ohne diese Zeiger musst
du jedesmal durch alles durchtippeln.

von Rolf M. (rmagnus)


Lesenswert?

Yalu X. schrieb:
> Edit:
>
> Macht man in diesem Beispiel str2 static, wird ebenfalls nicht mehr
> optimiert. Das sich da Ganze in der main-Funktion abspielt, besteht
> eigentlich keine Gefahr, dass str2 irgendwo überschreiben wird. Jedoch
> behandelt GCC main wie jede andere C-Funktion. Und würde die Funktion im
> Beispiel nicht main, sondern func heißen, könnte es tatsächlich sein,
> dass vor dem Aufruf von func ein Stück Code ausgeführt wird, der über
> abenteuerliche Zeigeroperationen str2 verändert.

Diese abenteuerlichen Zeigeroperationen rufen aber in C undefiniertes 
Verhalten hervor, somit darf ja Mist rauskommen, wenn str2 verändert 
wurde. Der Compiler muss das also eigentlich nicht berücksichtigen.

Jörg W. schrieb:
>>> wer macht so etwas wenn es Array gibt?
>>
>> Microsoft, natürlich! Beispiel:
>> https://msdn.microsoft.com/en-us/library/ms683187(v=vs.85).aspx
>
> Environment-Variablen haben ja nun nichts in erster Linie mit
> Microsoft zu tun.

Nein, aber dass es um Environment-Variablen geht, ist ja hier nicht das 
Problem, sondern die Art, wie die API-Funktion sie zurückgibt. Und die 
ist auf Microsofts Mist gewachsen.

von Yalu X. (yalu) (Moderator)


Lesenswert?

Rolf M. schrieb:
> Diese abenteuerlichen Zeigeroperationen rufen aber in C undefiniertes
> Verhalten hervor

Nicht unbedingt. Wenn die Funktion einen Zeiger auf die als static
deklarierte lokale Variable (bspw. über den Rückgabewert) anderen
Programmteilen zu Verfügung stellt, dürfen diese damit die Variable ganz
legal verändern. Beim nächsten Aufruf der Funktion steht dann in der
Variable etwas anderes, obwohl sie lokal ist.

Ok, in diesem Fall ist es die Funktion selbst, die die Adresse ihrer
lokalen Variable anderen Programmteilen preisgibt. Der Compiler könnte
die Optimierung also auf diejenigen Fälle beschränken, wo er sicher sein
kann, dass der Array-Zeiger nicht nach außen gelangt. Dazu müsste er nur
die Funktion selbst (und keine externen Programmteile) analysieren, was
ja prinzipiell machbar sein sollte, da die dafür benötigten Algorithmen
zur Datenflussanalyse sowieso schon existieren.

von Jochen (Gast)


Lesenswert?

Wow! Was für eine Diskussion!
Für mich gilt: Verwende" strlen", auch wenn es länger dauert.

von Rolf M. (rmagnus)


Lesenswert?

Yalu X. schrieb:
> Rolf M. schrieb:
>> Diese abenteuerlichen Zeigeroperationen rufen aber in C undefiniertes
>> Verhalten hervor
>
> Nicht unbedingt. Wenn die Funktion einen Zeiger auf die als static
> deklarierte lokale Variable (bspw. über den Rückgabewert) anderen
> Programmteilen zu Verfügung stellt, dürfen diese damit die Variable ganz
> legal verändern.

Klar, aber das ist nicht das, was ich unter "abenteuerliche 
Zeigeroperationen" verstehe.

: Bearbeitet durch User
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.