qad_doc2xml - Tutorial 2: Konvertierung eines Word-Dokuments in (X)HTML

 

Vorbereitung

Bevor Sie qad_doc2xml starten, werfen Sie ein Blick auf das zu konvertierende Word-Dokument (Ordner "\Examples\Tutorial2", Datei "Recipe.doc"). Es handelt sich dabei um ein mit Formatvorlagen strukturiertes Word-Dokument:


Starten Sie qad_doc2xml und wählen Sie das Word Dokument

Ordner "\Examples\Tutorial2", Datei "Recipe.doc". Wichtig: Bevor Sie qad_doc2xml starten, müssen Sie Word schließen, sonst erhalten Sie eine Fehlermeldung


Wählen Sie den Namen des neuen HTML-Dokuments

z. B. "recipe.html"


Bestimmen Sie die Regeln für die Konvertierung

Legen Sie wie dargestellt für jede Word Absatz-Formatvorlage einen HTML-Tag fest


Erste Konvertierung

Klicken Sie auf "Convert", dann auf "View XML" und sehen Sie sich das (vorläufige) Ergenis an


Sonderzeichen &...;

Sollten Sonderzeichen, z. B. "é" in "Entrée" nicht richtig dargestellt werden, können Sie die Funktion "use char_conversion_table" aktivieren. Sonderzeichen werden dann in &...; konvertiert.


"Hard Formats" - Bold, Italics

Sie können auch fett, kursiv und unterstrichenen Zeichen sowie Kapitälchen umwandeln. Markieren Sie die entsprechende Checkbox (Nachteil: Konvertierung dauert länger) und geben Sie an, welche HTML-Tags verwendet werden sollen. Sie können Attribute - falls nötig - direkt dahinter angeben.


Erneute Konvertierung

Führen Sie erneut eine Konvertierung durch und sehen Sie sich das Ergebnis an


Attribute

Sie können für Paragraph-Styles ebenfalls Attribute angeben wenn Sie möchten. Klicken Sie auf das Feld "Special", dann öffnet sich ein weiteres Fenster, in dem Sie die Attribute festlegen können (die weiteren Funktionen des "Set Attributes" Fenster sind für die Konvertierung in XHTML in der Regeln nicht notwendig, Sie finden weitere Informationen in dem Tutorial 1)


Templates

HTML Dokumente haben in der Regel einen ausführlichen Head-Bereich. Auch diesen können Sie sich automatisch hinzufügen lassen. Sehen Sie sich die Datei "xhtml_template.txt" in einem normalen Editor an (z. B. dem Notepad). Sie können diese Datei vor und nach dem Bereich <!-- word text --> beliebig verändern. Verändern Sie z. B. den Title-Wert oder setzten Sie die Body-Attribute und fügen Sie dann das Template hinzu, indem Sie auf die Taste "Select Tmpl." klicken.


Tag-Level

Es ist auch möglich, Tags zu verschachteln. Details finden Sie im XML-Tutorial.. Hier ein Beispiel für HTML:

Verändern Sie die Konvertierung für "Standard" und "Ingredients" wie dargestellt.

Klicken Sie auf das weiße "Special"-Feld bei "Ingredients" und aktivieren Sie die Funktion "ignore text" (Details siehe XML-Tutorial.)


Konvertierungsregeln speichern

Sie können die von Ihnen erstellten Konvertierungsregeln speichern, um ähnliche Dokumente nach gleichem Muster zu konvertieren. Wählen Sie dafür die Schaltfläche "Save Ruleset"


siehe auch XML-Tutorial

<<Zurück