www.mikrocontroller.net

Forum: PC-Programmierung Perl regexp mehrere Muster ersetzen bei gegenseitigem Aussschluss


Autor: Zwirbel (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Ich möchte in einem String mehrere Muster durch etwas anderes ersetzen.

Beispiel: aabbccddeebbddhh

Ersatz: bbcc => bb
        bbdd => jj

Ergebnis: aabbddeejjhh

Beide Ersetzungen sollen zum tragen kommen.
Aber sie sollen sich gegenseitig ausschliessen.
D.h. entsteht, wie in dem Beispiel beim Ersatz ein Muster das wiederrum 
ersetzt werden "könnte", so soll es trotzdem nicht ersetzt werden.

Soweit, so gut.

In perl, c etc. ist das kein Problem wenn einfach ein Buffer mit der 
längsten Länge gelesen und mit den Mustern verglichen wird. Wenn ein 
Ersatz vorgenommen wurde, dann wird der Buffer um die Zeichen die 
ersetzt wurden weitergeschaltet.

Aber geht das auch in perl regexps?
Ich kann ja mit s/bbcc/bb/ nur einzelne Muster erkennen und ersetzen.
Aber wenn ich zwei solche Ersetzungen hintereinanderschalte, dann 
ersetzt er mir vielleicht was, was (gemäß obiger Forderung) nicht mehr 
ersetzt werden soll.

Also z.B.

aabbccddeebbddhh      s/bbcc/bb/          aabbddeebbddhh
                      s/bbdd/jj/          aajjeejjhh          # so 
nicht!

Frage also, geht das anders mit regexps?

Autor: Εrnst B✶ (ernst)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Du kannst im Replacement-Part der Regexp einfach einen Hash-Lookup 
machen und so beide Ersetzungen "gleichzeitig" ausführen.

Zum Bleistift:
my $a="aabbccddeebbddhh";
my %replacement=(bbcc=>'bb',bbdd=>'jj');
$a=~s/(bbcc|bbdd)/$replacement{$1}/g;
print $a;
Ergibt:
aabbddeejjhh

Wird so ähnlich oft beim HTML-Escaping angewandt, damit "<" zu "&lt;" 
und eben nicht "&amp;lt;" wird:
my %html_escape = ('&' => '&amp;', '>'=>'&gt;', '<'=>'&lt;', '"'=>'&quot;');
my $html_escape = qr/([&<>"])/;

sub basic_html_escape
{
    return unless defined ${ $_[0] };

    ${ $_[0] } =~ s/$html_escape/$html_escape{$1}/mg;
}

Autor: Zwirbel (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
@ Ernst

Ich muss schon sagen.

Danke.

Autor: Zwirbel (Gast)
Datum:

Bewertung
0 lesenswert
nicht lesenswert
Dieses "&amp;lt;" ist mir aber schon öfter untergekommen.

Na ja. Vielleicht liest einer diesen Thread.

;-)

Antwort schreiben

Die Angabe einer E-Mail-Adresse ist freiwillig. Wenn Sie automatisch per E-Mail über Antworten auf Ihren Beitrag informiert werden möchten, melden Sie sich bitte an.

Wichtige Regeln - erst lesen, dann posten!

  • Groß- und Kleinschreibung verwenden
  • Längeren Sourcecode nicht im Text einfügen, sondern als Dateianhang

Formatierung (mehr Informationen...)

  • [c]C-Code[/c]
  • [avrasm]AVR-Assembler-Code[/avrasm]
  • [code]Code in anderen Sprachen, ASCII-Zeichnungen[/code]
  • [math]Formel in LaTeX-Syntax[/math]
  • [[Titel]] - Link zu Artikel
  • Verweis auf anderen Beitrag einfügen: Rechtsklick auf Beitragstitel,
    "Adresse kopieren", und in den Text einfügen




Bild automatisch verkleinern, falls nötig
Bitte das JPG-Format nur für Fotos und Scans verwenden!
Zeichnungen und Screenshots im PNG- oder
GIF-Format hochladen. Siehe Bildformate.
Hinweis: der ursprüngliche Beitrag ist mehr als 6 Monate alt.
Bitte hier nur auf die ursprüngliche Frage antworten,
für neue Fragen einen neuen Beitrag erstellen.

Mit dem Abschicken bestätigst du, die Nutzungsbedingungen anzuerkennen.