vraagje xml

hoi,

ik ben bezig met een test xml

een vraag waar ik geen antwoord op vind.

“Waarom is het niet zo eenvoudig om een Microsoft Word Document in een goed gestructureerd XML-Formaat om te zetten?”

weet iemand waarom?

het antwoord zit al in je vraag:

Word is van Microsoft en die weigeren over het algemeen open standaarden te aanvaarden (alhoewel daar de laatste tijd enige verandering in komt) Maar ik dacht dat de laatste word versies een export to XML feature hebben, die op PC heeft het zeker die voor mac ben ik niet zeker van.

ok bedankt (weer een puntje meer :innocent: )

.rtf is geloof ik een xml-vorm.. dus als je 'm export naar .rtf dan heb je een xml-bestand.. dan eventueel met xsl omzetten naar duidelijke xml

XML gebruik je op het moment dat je tekst semantisch gaat taggen. Je typeert de [i:f5e3575177]functie[/i:f5e3575177] van de diverse contentdelen. Je moet dus iets hebben waarmee je je content formeel benoemt. Zoiets doe je in een dtd. Aan de hand daarvan kun je een conversieslag over je Word-document laten lopen, vooropgesteld dat je daar op de een of andere manier markeringen in hebt aangebracht door bijv. stijlen.

Dat proces valt overigens heel moeilijk te automatiseren.

En daarin verschilt XML dus van o.a. RTF:
RTF is een opslagformaat, waarmee je [i:f5e3575177]layout[/i:f5e3575177]kenmerken meegeeft aan tekst.
Dat is iets wat je per definitie niet kunt met XML!