Word zu XML
Verfahren
Zur Transformation eines Worddokumentes nach XML gemäß Ihrer DTD muss in zwei Schritten vorgegangen werden.
Der Grund hierfür ist die Tatsache, dass in einem Worddokument bereits XML enthalten ist, welches vorteilhaft für eine Transformation geeignet ist.
Schritt 1
Entnahme der XML-Bestandteile aus dem DOCX-Format des Worddokumentes und Normalisierung dieser XML-Daten.
Diese XML-Daten enthalten eine Beschreibung der Formatierungen in Word. Die normalisierte Fassung reduziert die Datenstrukturen auf die nötigen Informationen.
Schritt 2
Aus den normalisierten XML-Daten werden die XML-Daten anhand der Formatbeschreibungen und kunden- oder werkspezifischer Übersetzungsregeln in semantische XML-Daten gemäß Ihrer DTD transformiert.