Forum: PC-Programmierung Java Stringverarbeitung

von Julian (Gast)

27.01.2022 08:44

Lesenswert?

•

Servus ich suche nach einer Möglichkeit wie mehrfach direkt 
hintereinander auftretende Zeichen nur einmal angezeigt werden also z.B:
Eingabe: Haaaaallo Juliaan
Ausgabe: Hallo Julian

Wenn ich z.B wüsste es kommt nur doppelt könnt ich ja
eingabe.replace("aa", "a"); machen

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #6956432 wurde von einem Moderator gelöscht.

Beitrag #6956435 wurde von einem Moderator gelöscht.

Re: Java Stringverarbeitung

von Jens S. (djstorm)

27.01.2022 08:59

Lesenswert?

•

▲
▼

> Eingabe: Haaaaallo Juliaan
> Ausgabe: Hallo Julian

Perfektes Beispiel für die Gegenüberlegung: Was mache ich, damit das bei 
"Hallo" mit den 2 l nicht passiert...

Ansonsten: Zur Not replace machen bis sich die Stringlänge nicht mehr 
ändert.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Ozvald K. (Firma: Privat) (ozvaldk)

27.01.2022 09:04

Lesenswert?

•

▲
▼

Pseudocode:

while exist "aa"
replace("aa", "a")

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Sebastian M. (basti_481803)

27.01.2022 09:04

Lesenswert?

•

▲
▼

Ja irgendwie mit z.B mit dem Replace nur das a anschauen also das wird 
nicht das Problem

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Sebastian M. (basti_481803)

27.01.2022 09:11

Lesenswert?

•

▲
▼

> while exist "aa"
> replace("aa", "a")

Danke dir

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von 🐧 DPA 🐧 (Gast)

27.01.2022 09:29

Lesenswert?

•

▲
▼

Bei Java bin ich mir gerade nicht sicher, wie man das man besten angeht. 
In JS könnte man das hier machen: "Haaaaallo 
Juliaan".replace(/(.)\1*/g,x=>x[0]) Oder das hier: [..."Haaaaallo 
Juliaan"].reduce((a,b)=>a[a.length-1]==b?a:a+b)

In Java kenne ich keine schöne variante. Man könnte eventuell sowas 
machen:

class MyUtils {
  public static String dedupeString(String str){
    if(str == null)
      return null;
    if(str == "")
      return "";
    char[] chars = str.toCharArray();
    char last = chars[0];
    String result = last+"";
    for(int i=1,n=chars.length; i<n; i++)
      if(last != chars[i])
        result += last = chars[i];
    return result;


Vermutlich funktioniert das aber alles bei längeren unicode Zeichen 
nicht mehr richtig.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Achim H. (anymouse)

27.01.2022 10:15

Lesenswert?

•

▲
▼

Wenn es nur um jeweils ein Zeichen geht (replaceAll verwendet Regex):

        String v = "Haalllo Jullliiiaaaan";
        String h = v.replaceAll("a+", "a");
        assertEquals("Halllo Jullliiian", h);

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Achim H. (anymouse)

27.01.2022 10:22

Lesenswert?

•

▲
▼

Jedes doppelte Zeichen:

String v = "Haalllo Jullliiiaaaan";
String h = v.replaceAll("(\\w)\\1+", "$1");
assertEquals("Halo Julian", h);

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Achim H. (anymouse)

27.01.2022 10:27

Lesenswert?

•

▲
▼

https://codereview.stackexchange.com/questions/5618/replace-multiple-occurrences-of-a-character

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von DPA (Gast)

27.01.2022 10:37

Lesenswert?

•

▲
▼

Interessant wäre jetzt als test case "🐧🐧". Schlägt sicher überall fehl.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Alonzo Mutex (Gast)

28.01.2022 09:00

Lesenswert?

•

▲
▼

DPA schrieb:
> Interessant wäre jetzt als test case "🐧🐧". Schlägt sicher
> überall fehl.

Java kann UTF-8.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von 🐧 DPA 🐧 (Gast)

28.01.2022 09:30

Lesenswert?

•

▲
▼

Gerade ausprobiert. Mit dem Regex (wenn man . stat \\w nimmt), geht 
tatsächlich auch "🐧🐧" in java. Wobei sowas "👨‍👩‍👧‍👦👨‍👩‍👧‍👦" würde auch 
wieder nicht mehr funktionieren.

Die JavaScript Varianten kommen mit beidem nicht klar. Eine variante, 
die bei JS geht, wäre: 
[..."🐧🐧"].reduce((a,b)=>a[a.length-1]==b?a:[...a,b],[]).join('')

Auch die geht aber bei "👨‍👩‍👧‍👦👨‍👩‍👧‍👦" nicht mehr. Liegt aber zwar eher 
daran, dass es sehr kompliziert und manchmal unklar ist, wann in unicode 
etwas ein glyph ist, und wann nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Alonzo Mutex (Gast)

28.01.2022 17:00

Lesenswert?

•

▲
▼

🐧 DPA 🐧 schrieb:

Berichtige:
Sourcecode ist UTF-8 obwohl man das per -D Schalter iirc ändern kann.

Strings sind sogar UTF-16:
https://docs.oracle.com/javase/10/docs/api/java/lang/Character.html#unicode


https://stackoverflow.com/questions/5729806/encode-string-to-utf-8

88
In Java7 you can use:

import static java.nio.charset.StandardCharsets.*;
byte[] ptext = myString.getBytes(ISO_8859_1); 
String value = new String(ptext, UTF_8);


This has the advantage over getBytes(String) that it does not declare 
throws UnsupportedEncodingException.

If you're using an older Java version you can declare the charset 
constants yourself:

import java.nio.charset.Charset;
public class StandardCharsets {
    public static final Charset ISO_8859_1 = Charset.forName("ISO-8859-1");
    public static final Charset UTF_8 = Charset.forName("UTF-8");
    //....

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Markus L. (rollerblade)

29.01.2022 15:44

Lesenswert?

•

▲
▼

Alonzo Mutex schrieb:
> Strings sind sogar UTF-16
Nö, Unicode.
UTF-16 ist eine Kodierung mit variabler Länge für Unicode-Zeichen (aus 
Wikipedia). Unicode in Java hat eine fixe Länge.

Das da

byte[] ptext = myString.getBytes(ISO_8859_1);
String value = new String(ptext, UTF_8);

ist Unfug. Aus dem String wird ein ISO8859-1 codierter Bytearray 
erzeugt. Dann soll dieser Bytearray plötzlich wie aus dem Nichts UTF-8 
codiert sein.
Damit zerschießt man sich wunderbar alle Zeichen oberhalb von ASCII.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Alonzo Mutex (Gast)

29.01.2022 20:02

Lesenswert?

•

▲
▼

Markus L. schrieb:
>  Unicode in Java hat eine fixe Länge.
Wenn nur Zeichen vorhanden sind die alle in eine 1-byte Zeichensatz 
passen, dann wird der intern verwendet, das passiert dynamisch.

http://tutorials.jenkov.com/java/strings.html#internal-string-representation

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Noch ein Kommentar (Gast)

29.01.2022 21:49

Lesenswert?

•

▲
▼

Das Problem beim Java sind die "Unicode planes".

Ursprünglich gab es nur 2^16 Unicode Zeichen. Später kamen die 
Supplementary Planes dazu.

Das Java benutzt 16 Bit für char. Als Unicode die zusätzlichen Planes 
definierte, ist Java bei 16 Bit geblieben. Die zusätzlichen Zeichen 
brauchen im String 2 char.

Wenn man die neuen Planes benutzen will, muss man auch die neuen Java 
Methoden benutzen.
char charAt(int index)
int codePointAt(int index)

War lange kein Problem. Aber jetzt hat Unicode die Emjos in eine 
Supplementary Plane gepackt. U+1F600 ...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Alonzo Mutex (Gast)

30.01.2022 09:40

Lesenswert?

•

▲
▼

Da sieht man wieder was für Krampf non-ASCII ist. Unicide, UTF sollte 
das mal alles lösen jetzt hat man wieder zig Varianten davon, nix 
funktioniert wie man es wollte, man muss erst wieder herumraten was das 
sein könnte wenn man nicht sicher weiss was rein kommt, ist das alles 
ein Schrott.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: Java Stringverarbeitung

von Noch ein Kommentar (Gast)

30.01.2022 11:54

Lesenswert?

•

▲
▼

> nix funktioniert wie man es wollte

Na ja, besser wäre gewesen, Unicode hätte von Anfang an mehr als 2^16 
Zeichen vorgesehen.

Aber der Krampf, den das Java für die Rückwärtskompatibilität betreibt, 
funktioniert erstaunlich gut.

Solange man nur String benutzt, machen die mitgelieferten Libraries 
alles richtig. Nur wenn du String.toCharArray() oder String.charAt() 
aufruft, musst du dran denken, ein Zeichen kann 1 oder 2 char haben.

Hatten mal einen Bugreport, Emjos funktionieren nicht. Da stellte sich 
heraus, unser Programm und alle Libraries machten alles richtig, nur die 
Mysql hatte als Default ein Encoding, in dem die neuen Planes nicht 
funktionierten.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #6962558 wurde von einem Moderator gelöscht.

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net