Hi
Ich hab schon öfter beim Schreiben/Verarbeiten von XML mich über den
Konflikt von ordentlicher Formatierung und Inhalt geärgert.
wenn man den XML-Code ordentlich hierarchisch schreibt und einrückt hat
man ein Problem bei den Text-Nodes, dass die Einrückung und Umbrüche,
die eigentlich nur der Übersichtlichkeit dienen die Nutzdaten
beeinflussen.
1 | <someXml>
|
2 | <substructure><- nl a
|
3 | <someText><- nl b
|
4 | <- f ->this is some text that should be left aligned.
|
5 | <- f -><- t ->some more text.<-nl b
|
6 | </someText>
|
7 | </substructure>
|
8 | </someXml>
|
der mit f gekennzeichnete Teil ist eigentlich unerwünscht.
gleiches gilt für die mit "<- nl b" gekennzeichneten Zeilenumbrüche
der mit t gekennzeichnete Teil ist erwünscht.
die Zeilenumbrüche "<- nl a" (und der Whitespace am Anfang neuen Zeile)
sind unter Umständen sogar schädlich für die erfolgreiche Validierung
eines Dokumentes, da sie einen Textknoten einfügen, der laut Schema
eventuell gar nicht erlaubt ist.
und so möchte man normalerweise sein xml nicht schreiben:
1 | <someXml><substructure><someText>this is some text that should be left aligned.
|
2 | some more text.</someText></substructure></someXml>
|
gibts hierfür irgendwelche eleganten Lösungen?
(ich benutze meist die libxml)
Gruß
Vlad