strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 13:01

Lesenswert?

•

Hallo,

ich habe die Funktion strcmp(...) aus musl libc

http://git.musl-libc.org/cgit/musl/tree/src/string/strcmp.c

mit der gleichen Funktion aus glibc

https://github.com/bminor/glibc/blob/master/string/strcmp.c

verglichgen.

Beide rechnen mit "unsigned char". Aber macht diese return-Anweisung aus 
musl-libc Sinn?

return *(unsigned char *)l - *(unsigned char *)r;

Wegen integer promotion wird doch die Subtraktion mit int's durchgeführt 
und dann das Ergebnis einem int-Rückgabewert zugewiesen. Also ist diese 
Typumwandlung an dieser Stelle gar nicht nötig.

Bei glibc wird ja gleich zu Beginn umgewandelt. Aber erst bei einer 
return-Aweisung? Das ist doch gar nicht nötig oder?

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Oliver S. (oliverso)

22.03.2020 13:12

Lesenswert?

•

▲
▼

zitter_ned_aso schrieb:
> Wegen integer promotion wird doch die Subtraktion mit int's durchgeführt

Mal ganz generell gefragt: was genau hast du eigentlich mit der lib vor? 
Nutz die, wie sie ist, oder lass es.

Oliver

22.03.2020 13:13: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 13:17

Lesenswert?

•

▲
▼

Mal generell gefragt warum nein? Alles war "unter" int ist, wird bei 
Berechnungen als int / unsigned int  betrachtet oder nicht?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von foobar (Gast)

22.03.2020 13:27

Lesenswert?

•

▲
▼

Überleg dir, was bei Zeichen außerhalb des Bereichs 0-127 passiert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Carl D. (jcw2)

22.03.2020 13:39

Lesenswert?

•

▲
▼

In der gnu-Version fallen mir unnötige casts auf, um const zu entfernen. 
Aber c1/c2 werden nie verändert. Die musl-Variante ist zwar sehr knapp 
gehalten, aber frei von solchen "Unzulänglichkeiten". Und der cast auf 
unsigned Char wird gebraucht, um Zeichen >127 korrekt zu vergleichen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 17:12

Lesenswert?

•

▲
▼

zitter_ned_aso schrieb:
> return *(unsigned char *)l - *(unsigned char *)r;
> Wegen integer promotion wird doch die Subtraktion mit int's durchgeführt
> und dann das Ergebnis einem int-Rückgabewert zugewiesen. Also ist diese
> Typumwandlung an dieser Stelle gar nicht nötig.

nach langem Überlegen:

Integer promotion findet natürlich statt. Allerdings werden da falsche 
Zahlen zu Integer's befördert weil es bei den Buchstaben mit dem 
ASCII-Code > 127 einen Überlauf gibt (bei signed char). Und diese, 
falsche Zahl, wird nach "int" umgewandelt.

Bei mir funktioniert's übrigens auch wenn BEIDE Buchstaben >127 sind 
ohne explizite Typumwandlung.

return *l - *r;


Dann gibt es ja für beide einen Überlauf, aber der Abstand bleibt ja 
trotzdem gleich. Aber so ein Überlauf ist ja bei signed-Werten nicht 
definiert.Wenn es nur bei einem Buchstaben diesen Überlauf gibt, dann 
geht die Version ohne explizites Casten in die Hose.

Und dann habe ich noch eine Frage:
Warum wird die erste Variante akzeptiert und bei der zweiten - gewarnt?

 char str1[]="ü";                                                  
 char str2[]={'ü','\0'};

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Carl D. (jcw2)

22.03.2020 17:19

Lesenswert?

•

▲
▼

zitter_ned_aso schrieb:
>
> Bei mir funktioniert's übrigens auch wenn BEIDE Buchstaben >127 sind
> ohne explizite Typumwandlung.
>

Aber manchmal hat man <=127/>127 gemischt.
Z.B. "aaaa" vs. "ääää". Was sagt dann dein Algorithmus?

22.03.2020 17:20: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 17:26

Lesenswert?

•

▲
▼

Carl D. schrieb:
> Z.B. "aaaa" vs. "ääää"

na dann bekomme ich ein falsches Ergebnis, habe ich doch oben 
geschrieben.


bei 'a' gibt es keine Überlauf, bei 'ä' schon.

zitter_ned_aso schrieb:
> Wenn es nur bei einem Buchstaben diesen Überlauf gibt, dann
> geht die Version ohne explizites Casten in die Hose.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von foobar (Gast)

22.03.2020 17:52

Lesenswert?

•

▲
▼

Es gibt nirgendwo einen Überlauf.

Du hast ein 8-Bit-Muster und je nach Interpretation entspricht das 
-128..127 (signed char) oder 0..255 (unsgined char).  Die Erweiterung 
nach int ist in beiden Fällen eindeutig definiert und die folgende 
(int-)Subtraktion erfolgt ohne Überlauf, liefert aber je nach 
Interpretation unterschiedliche Ergebnisse.

ANSI-C verlangt bei strcmp (und auch bei memcmp) die 
unsigned-Interpretation.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 18:10

Lesenswert?

•

▲
▼

Warum ist das kein Überlauf?

Ich kann das ja sogar nachbilden:

    char ch=i; //Ueberlauf, da char==signed char                        
    printf("\ngegebener Integerwert: \t%d\n", i);                       
    printf("falscher Integerwert: \t%d\n", i_wrong);                    
    printf("Ueberlauf von  char: \t%d\n", ch);                          
    printf("auf uchar gecastet: \t%u\n", (unsigned char)ch);            
    printf("Ueberlauf berechnet: \t%d\n\n", (i%128)+(-128));


und die Ausgabe (bei mir):

gegebener Integerwert:  225
falscher Integerwert:   -31
Ueberlauf von  char:    -31
auf uchar gecastet:     225
Ueberlauf berechnet:    -31

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von foobar (Gast)

22.03.2020 18:15

Lesenswert?

•

▲
▼

> Warum ist das kein Überlauf?

Äppel und Birnen?  Du wandelst von int nach char, strcmp von char nach 
int.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Rolf M. (rmagnus)

22.03.2020 18:18

Lesenswert?

•

▲
▼

zitter_ned_aso schrieb:
> Warum ist das kein Überlauf?

Es ist einfach nur eine andere Interpretierung der Bits.

Übrigens gibt es in C per Definition keine Überläufe.

22.03.2020 18:24: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von leo (Gast)

22.03.2020 18:25

Lesenswert?

•

▲
▼

Rolf M. schrieb:
> Übrigens gibt es in C per Definition keine Überläufe.

Quelle bitte.

leo

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von zitter_ned_aso (Gast)

22.03.2020 18:43

Lesenswert?

•

▲
▼

zitter_ned_aso schrieb:
> char str1[]="ü";
>  char str2[]={'ü','\0'};

so, als hex-Code geht's:

 char str2[]={'\xFC','\0'};


aber in der Console wird dann

<fc>


angezeigt. Im string werden die Zeichen aus dem erweiterten 
ASCII-Zeichensatz direkt akzeptiert, als einzelne char's jedoch nicht 
(egal ob signed/unsigned). Diese muss man dann codiert eingeben oder 
wchar nutzen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Rolf M. (rmagnus)

22.03.2020 19:22

Lesenswert?

•

▲
▼

leo schrieb:
> Rolf M. schrieb:
>> Übrigens gibt es in C per Definition keine Überläufe.
>
> Quelle bitte.

Aus ISO/IEC 9899. Ok, stimmt nicht ganz. Bei Gleitkomma-Typen kann es 
Überläufe geben.

Zu unsigned Integern:

"A computation involving unsigned operands can never overflow,
because a result that cannot be represented by the resulting unsigned 
integer type is reduced modulo the number that is one greater than the 
largest value that can be represented by the resulting type."

Bei vorzeichenbehafteten Integern darf man nicht auf einen Überlauf 
vertrauen, da das Verhalten undefiniert ist. Dazu hab ich direkt keine 
Passage gefunden, außer vielleicht dieser:

"If an exceptional condition occurs during the evaluation of an 
expression (that is, if the result is not mathematically defined or not 
in the range of representable values for its type), the behavior is 
undefined.

22.03.2020 19:23: Bearbeitet durch User

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von leo (Gast)

22.03.2020 19:33

Lesenswert?

•

▲
▼

Rolf M. schrieb:
> Zu unsigned Integern:

Du hattest nur diese gemeint oder auch signed integer? Bei letzteren 
gibt es sicher Overflow.

$ pdftotext c-std-n1256.pdf - | grep -c overflow

leo

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Rolf M. (rmagnus)

22.03.2020 19:44

Lesenswert?

•

▲
▼

leo schrieb:
> Rolf M. schrieb:
>> Zu unsigned Integern:
>
> Du hattest nur diese gemeint oder auch signed integer?

Hatte ich doch geschrieben:

Rolf M. schrieb:
> Bei vorzeichenbehafteten Integern darf man nicht auf einen Überlauf
> vertrauen, da das Verhalten undefiniert ist.

leo schrieb:
> $ pdftotext c-std-n1256.pdf - | grep -c overflow
> 33

Das Wort "overflow" kommt schon vor, dennoch ist es so, dass unsigned 
integer nicht überlaufen können und ein Überlaufverhalten für 
signed-Integer nicht definiert ist.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von leo (Gast)

22.03.2020 19:48

Lesenswert?

•

▲
▼

Rolf M. schrieb:
> und ein Überlaufverhalten für
> signed-Integer nicht definiert ist.

Ja, haette ich genauer lesen muessen. Wie auch immer Overflow passiert 
;)

leo

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: strcmp() aus musl libc

von Jemand (Gast)

22.03.2020 20:19

Lesenswert?

•

▲
▼

7.17.7.5 The atomic_fetch and modify generic functions
For signed integer types, arithmetic is defined to use two’s
complement representation with silent wrap-around on overflow; there are no undefined

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC-Programmierung strcmp() aus musl libc