Hallo, weiss jemand wie man mehrere XML-Dateien gleicher Struktur mit überlappenden Inhalten in eine große XML Datei verschmelzen kann ? Ich habe über meherer Monate Daten in einer Round Robin Datei aufgenommen. Von Zeit zu Zeit habe ich Sicherungen dieser Datei gemacht. So entstanden mehrere kleinere Dateien, die abschnittsweise den gleichen Inhalt haben. Ich würde jetzte gerne diese Dateien in eine einzige Datei zusammenführen, wobei natürlich die mehrfach vorhandenn Daten nur einmal vorhanden seinsollen. Verschiedene XML Merger habe ich schon probiert. Diese vertragen aber entweder die Dateilängen nicht (jede etwa 40MB gross) und stürzen ab, oder sie hängenn die Dateien einfach aneinander. Bin für jeden Tip dankbar.
Schlicht und einfach: Diff und Patch --> http://www.gnu.org/software/diffutils/manual/html_node/index.html
Dank, wäre schön. Wenn ich es aber richtig sehe muss das erst compiliert werden. Leider tue ich mir damit sehr schwer. Suche was exe-mässiges, was unter Windows läuft.
Ok, danke, habe ich gefunden. Entschuldige, wenn ich mich etwas doof anstelle, aber so recht geht es trotzdem nicht weiter. Habe "sdiff -oab-xml a.xml b.xml" ausgeführt. Es wird zwar ein ab.xml erstellt, da steht auch eine Zeile Text drin, aber das wars dann. Es kommt im DOS Fenster % ed: usw. aber selbst q geht nicht mehr. In der Docu zu sdiff habe ich diese Kommandos gar nicht gefunden.
Wenn die XML Struktur nicht allzu kompliziert ist könntest Du mit XSLT deinen eigenen Konverter schreiben. Vorausgesetzt natürlich, du verfügst über Programmierkenntnisse und hättest auch Interesse an so etwas.
Den interaktiven Modus mit -y benutzen? Oder wolltest du es komplett automatisch?
Wäre mir egal, nur das Ergenbis zählt. -y gibt es aber leider nicht ! oder ? Danke
@peterguy Interesse hätte ich grundsätzlich schon, aber mir fehlt es an den entprecheden Programmierkenntnissen.
Was heißt den gleich? Gleiche Zeilen? Gleiche Datensätze? Datensätze die mehr enthalten als der Vorherige.... z.B. einmal <X> <Y>Wert 1</Y> </X> <X> <Y>Wert 1</Y> <Y>Wert 2</Y> </X> oder wie sieht das aus?
Wie schon oben erwähnt, handelt es sich um Round Robin Dateien die mit RRDTOOL erzeugt wurden. Darin sind ca. 30 Temperaturen jede Minute geloggt. Der älteste Eintrag wird nach 35 Tage überschrieben. Vorher habe ich die Datei gesichert (und auch zwischendurch mal), sodass ich jetzt mehrere Dateien mit gleicher Struktur habe. Diese unterscheiden sich nur vom Inhalt her vom Datum, der Zeit und der Temperaturen natürlich. Innerhalb der Dateien gibt es natürlich Bereiche, die vom Datum, Zeit und Temperatur her die gleichen Einträge haben, nur die Position innerhalb der RR Datei ist anders. Diese doppelten (oder ggf. mehrfachen Einträge da mehrere Dateien) möchte ich gerne beim Zusammenfassen herausnehmen. Die Dateien liegt im RRDTool Format und gewandelt im XML-Format vor. Wenn mir es also einmal gelingen sollte, aus den meherer Dateien eine einzige XML Datei zu generieren, wird diese dann zur Auswertung wieder ins RDDTOOL Format zurückgewandelt. So stelle ich mir das jedenfalls vor. Danke für die Unterstützung
Wenn du mir mal 2 - 3 beispiel Dateien zusendest schau ich mir das mal an, und würde dir ggf nen Programm schnell zusammenstricken.
Das wäre ja Spitze! Die Dateien sind aber recht lang 60 MB je Stück Melde dich bitte mal hier. botnec@gmx.de Vielen herzlichen Dank schon mal.
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.