c#: substring unbekannter länge aus string entfernen

von Waldemar Kalov (Gast)

24.01.2017 10:56

Lesenswert?

•

Hi,
die Überschrift ist etwas verwirrend, was ich möchte ist folgendes.
Ich habe eine Datei mit HTML-Elementen. in dieser Datei ist eine 
Vielzahl an Einträge wie z.B. <p class=...>

Was diese Einträge alle gmeinsam habe ist, dass sie mit "<p " beginnen 
und mit '>' aufhören.

Wie kann ich das aus einem string heraus löschen?

bsp:
string c = "typ: 0815 color: rot <p class="Device1"> pieces: 24"

das <p class=Device1> würde ich gerne heraus löschen...

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Peter II (Gast)

24.01.2017 10:59

Lesenswert?

•

▲
▼

Waldemar Kalov schrieb:
> Wie kann ich das aus einem string heraus löschen?

suche "<p"
wenn gefunden suche ab der stelle ">"

wenn gefunden substring mit den errechneten längen.

als Alternative kann man auch mit regulären ausdrücken arbeiten 
"<p[^>]*>"

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Waldemar Kalov (Gast)

24.01.2017 11:09

Lesenswert?

•

▲
▼

Hallo,
Danke für Deine Hilfe, aber ich verstehe das nicht ganz.
Ich wollte ursprünglich mit einer Schleife nach den Zeichen suchen, aber 
wenn ich per schleife den string durchsuche, dann weiß ich doch nicht an 
welcher Stelle ich mich gerade befinden wenn ich einen treffen mit '<' 
gefunden habe?

foreach (char Letter in Text)
  if (Letter == '<')
    // wie kann ich ich jetzt nach '>' suchen!?


Was meinst Du mit
> als Alternative kann man auch mit regulären ausdrücken arbeiten
> "<p[^>]*>"

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Dirk B. (dirkb2)

24.01.2017 11:18

Lesenswert?

•

▲
▼

Waldemar Kalov schrieb:
> Ich wollte ursprünglich mit einer Schleife nach den Zeichen suchen,

Du willst das selber machen und keine fertige Methode nehmen?
Ok.

> aber
> wenn ich per schleife den string durchsuche, dann weiß ich doch nicht an
> welcher Stelle ich mich gerade befinden wenn ich einen treffen mit '<'
> gefunden habe?

Dann musst du eben mitzählen, oder eine andere Schleife verwenden.
evtl. eine, wo du den Index durchgehst.


> Was meinst Du mit
>> als Alternative kann man auch mit regulären ausdrücken arbeiten
>> "<p[^>]*>"
Er meinte Reguläre  Ausdrücke (bitte selber googeln oder in 
Wikipedia nachschlagen)


Es gibt aber in der String-Klasse fertige Methoden, die dir den Index 
eines Zeichens liefern.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von blubb (Gast)

24.01.2017 11:23

Lesenswert?

•

▲
▼

Dirk B. schrieb:
> Reguläre  Ausdrücke

'regular expressions' ist das Wort womit man mehr infos finden sollte

Wäre aber auch meine erste Wahl gewesen :)

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Peter II (Gast)

24.01.2017 11:25

Lesenswert?

•

▲
▼

Waldemar Kalov schrieb:
> welcher Stelle ich mich gerade befinden wenn ich einen treffen mit '<'
> gefunden habe?

du must mit String.IndexOf arbeiten.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Waldemar Kalov (Gast)

24.01.2017 11:41

Lesenswert?

•

▲
▼

Hallo,
vielen Dank!
Peter II hat mir den entsprechenden Hinweis geliefert:

foreach(char Letter in meinText)
    if (Letter == '<')
        int Start = meinText.IndexOf('<');
        int Ende = meinText.IndexOf('>');
        meinText = meinText.Remove(Start, (Ende+1) - Start);

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Peter II (Gast)

24.01.2017 11:43

Lesenswert?

•

▲
▼

Waldemar Kalov schrieb:
> foreach(char Letter in meinText)

das brauchst du doch überhaupt nicht.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Dirk B. (dirkb2)

24.01.2017 11:50

Lesenswert?

•

▲
▼

.IndexOf gibt es in verschiedenen Variationen. Unter anderem auch mit 
einem zweiten Parameter vom Typ int32.

https://msdn.microsoft.com/de-de/library/5xkyx09y.aspx

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Peter II (Gast)

24.01.2017 11:50

Lesenswert?

•

▲
▼

so ist es sinnvoller

int pos = meinText.IndexOf('<');
while( pos > 0 ) {
        int Ende = meinText.IndexOf('>');
        meinText = meinText.Remove(Start, (Ende+1) - Start);
        pos = meinText.IndexOf('<');

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Peter II (Gast)

24.01.2017 11:51

Lesenswert?

•

▲
▼

Peter II schrieb:
> int pos = meinText.IndexOf('<');
> while( pos > 0 ) {
>         int Ende = meinText.IndexOf('>');
>         meinText = meinText.Remove(Start, (Ende+1) - Start);
>         pos = meinText.IndexOf('<');
> }

korrektur
[/c]
int pos = meinText.IndexOf('<');
while( pos > 0 ) {
        int Ende = meinText.IndexOf('>',pos  );
        meinText = meinText.Remove(Start, (Ende+1) - Start);
        pos = meinText.IndexOf('<');
}

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Dirk B. (dirkb2)

24.01.2017 12:06

Lesenswert?

•

▲
▼

Ein Test, ob Ende gültig ist, sollte auch noch drin sein.

Und das gesuchte Zeichen könnte ja durchaus auch an der ersten Stelle 
stehen.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Arc N. (arc)

24.01.2017 12:14

Lesenswert?

•

▲
▼

Oder einen passenden Parser nehmen z.B. 
http://htmlagilitypack.codeplex.com/wikipage?title=Examples oder das 
WebBrowser-Control nehmen, DocumentText setzen und, nachdem es 
geladen/geparst ist, über Document und bspw. über GetElementsByTagName 
die passenden raussuchen
https://msdn.microsoft.com/de-de/library/system.windows.forms.webbrowser.documenttext(v=vs.110).aspx
https://msdn.microsoft.com/de-de/library/system.windows.forms.htmldocument(v=vs.110).aspx

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Reginald L. (Firma: HEGRO GmbH) (reggie)

24.01.2017 12:20

Lesenswert?

•

▲
▼

Schau dich auch mal im namespace Linq um. Der beinhaltet auch lauter 
solcher Spielereien.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Reginald L. (Firma: HEGRO GmbH) (reggie)

24.01.2017 12:44

Lesenswert?

•

▲
▼

...und bezüglich regulärer ausdrücke gibt es die klasse Regex.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von c-hater (Gast)

24.01.2017 18:35

Lesenswert?

•

▲
▼

Waldemar Kalov schrieb:

> Was diese Einträge alle gmeinsam habe ist, dass sie mit "<p " beginnen
> und mit '>' aufhören.
>
> Wie kann ich das aus einem string heraus löschen?

Alle im Thread aufgezeigten Möglichkeiten sind mehr oder weniger 
mangelhaft, allerdings unter bestimmten Randbedingungen durchaus 
einsetzbar. Das Problem ist nur: du mußt halt irgendjemanden finden, der 
dir die Einhaltung der Randbedingungen garantiert...

Die universelle Lösung kann deshalb nur ein vollständiger HTML-Parser 
zur Ermittlung der "Schnittstellen" sein. Alles andere ist hilfloses 
Gefrickel, was im nächsten Moment schon den Bach runtergehen kann...

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: c#: substring unbekannter länge aus string entfernen

von Puh (Gast)

24.01.2017 19:09

Lesenswert?

•

▲
▼

Perlen vor die Säue.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Forum: PC-Programmierung c#: substring unbekannter länge aus string entfernen