Múltiples Formats Generació De Sortides En Continguts XML .

3y ago
38 Views
2 Downloads
2.15 MB
174 Pages
Last View : 16d ago
Last Download : 3m ago
Upload by : Louie Bolen
Transcription

Suport a la edició decontinguts XML DocBook icreació de fulls d'estil per a lageneració de sortides enmúltiples formatsMemòriaAnahí Olives PonsodaMaterial generat amb l'Editor de Materials Docents de la UPC

ContingutsPrefaci71Introducció92Tecnologies XML utilitzades132.1XML (Extensible Markup Language)132.2XSD (XML Schema Definition)182.3MathML (Mathematical Markup Language)232.4SPS (StyleVision Power Stylesheet)252.5XSL (Extensible Style Language)272.6XSLT (Extensible Style Language Transformations)312.7XSL:FO (Extensible Style Language: Formatting32Objects)2.833.13.2XPath (XML Path Language)Estudi de l'estàndard XML DocBook3337Característiques requerides383.1.1Fórmules matemàtiques383.1.2Objectes multimèdia393.1.3Estructura de llibre403.1.4Bibliografies i glossaris a tots els nivells413.1.5Enllaços423.1.6Citació bibliogràfica normalitzada433.1.7Notes al peu de pàgina443.1.8Llistes453.1.9Taules463.1.10 Test d'autoavaluació48Esquema d'etiquetes XSD493.2.151Etiquetes d'autoria del materialSuport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria3

4Etiquetes de bibliografia513.2.3Etiquetes d'objecte multimèdia523.2.4Etiquetes d'enllaç533.2.5Etiquetes d'estructura533.2.6Etiquetes de format543.2.7Etiquetes de fórmula543.2.8Etiquetes de glossari543.2.9Etiquetes de llista553.2.10 Etiquetes de taula553.2.11 Etiquetes de test55Suport a l'edició del document XML574.1Obtenció del full d'estils SPS574.2Formatejat d'elements simples624.3Formatejat d'elements complexes644.3.1Formularis664.3.2Càlculs ó que no s'introdueix des de l'SPS80Generació de sortides en múltiples formats83Principals característiques835.1.1Qualitat professional835.1.2Bona qualitat visual i impresa per a les fórmules845.1.3Salts de pàgina845.1.4Maquetat com un llibre d'editorial855.1.5Objectes multimèdia interactius865.1.6Site amb múltiples pàgines s al peu de pàgina915.1.10 Redimensionat d'imatges915.1.11 Bibliografia92Anahí Olives Ponsoda

5.26Organització de l'XSL en diversos fitxers925.2.1Fitxers màster935.2.2Fitxers pel format de l'índex935.2.3Fitxers pel format d'apartats955.2.4Fitxers pel format d'estructures organitzades975.2.5Fitxers pel format d'etiquetes bàsiques975.2.6Fitxers de configuració98Entorn de desenvolupament996.1Altova XMLSpy 2004996.2Altova Stylesheet Designer 20041036.3Saxon 81036.4Antenna House XSL Formatter 4.01046.5TreeView 4.51057Temporització1078Valoració econòmica1099Millores futures11110 Conclusions115Annex A117A.1A.2Referència de l'esquema XSDCóm interpretar un esquema XSD ltres símbols123Etiquetes per ordre alfabèticAnnex BAplicacions reals del projecteSuport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria1231615

Annex C6Exemples de materials elaborats165Glossari171Bibliografia173Anahí Olives Ponsoda

PrefaciEl present document s'ha creat fent servir l'esquema XSD1 , la plantilla SPS2 i els fulls d'estilXSL3 elaborats en aquest Projecte Final de Carrera.S'ha utilitzat l'Editor de Materials docents de la UPC (http://emdoc.upc.edu) per crear eldocument XML i generar aquest document PDF d'alta resolució, posteriorment imprès en unaimpremta. A més, a partir del mateix document XML s'ha generat també una versió navegable enformat HTML. Totes dues versions estan disponibles en el CD-ROM adjunt a la contraportadad'aquest llibre.AgraïmentsAbans de començar a entrar en matèria, voldria expressar el meu agraïment a les persones quehan fet possible que arribés fins aquí. En primer lloc, vull agrair al Ramón Martí, que em va donarla oportunitat de créixer professionalment i em va involucrar en aquest gran projecte que encaraavui dia continua millorant-se.També voldria agrair tot el suport que sempre he rebut per part de la meva família, sobre tot dela meva germana Núria que ha patit els efectes col·laterals de tots aquests anys de carrerainterminables ;-), i el recolzament per part dels meus companys de la UPC que han estat al meucostat en els moments bons i dolents des de fa ja sis anys: Ana, Isa, Lluïsa, Mari, Neus, Quim,Sisco i tota la resta.I per últim, però no per això menys importants, als companys de carrera que m'han ajudat asuportar el pesat pes de les classes de la FIB: Carlos, Dani, Ima, Ingrid, Isaac, Laia i Susana.Gràcies a tots!1 Veure l'apartat 2.22 Veure l'apartat 2.43 Veure l'apartat 2.5Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria7

8Anahí Olives Ponsoda

1. IntroduccióAquest Projecte Final de Carrera forma part de l'Editor de Materials Docents, un projecte de l'ICE(Institut de Ciències de l'Educació de la UPC) destinat a l'elaboració d'una eina que permeti lacreació de documents amb un format estàndard i homogeni.Fitxers elaborats en el projecte situats en l'entorn de l'Editor de Materials DocentsSuport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria9

La tecnologia base del projecte és l'XML (Extensible Markup Language), utilitzat per etiquetar elscontinguts del document i facilitar així el seu posterior tractament.El principal avantatge d'aquesta tecnologia és la possibilitat d'obtenir diversos formats de sortida(HTML, PDF, etc.) a partir d'un mateix document XML, de manera que es pot adaptar la sevapresentació al format més convenient depenent de la situació.Així, si es vol consultar el document online, es pot fer servir la versió HTML per navegar-hi mésfàcilment. En canvi, si es vol disposar d'una versió impresa, es pot obtenir un PDF que, donadala seva alta qualitat d'impressió, fins i tot pot ser utilitzat per una impremta.El projecte es conforma principalment de quatre grans apartats: la definició de l'esquema d'etiquetes XSD (XML Schema Definition) que s'utilitzarà peretiquetar i jerarquitzar els continguts XML. L'esquema és el resultat d'un estudi dut aterme sobre l'estàndard DocBook que, a causa del seu gran nivell de detall, es fanecessari obtenir-ne un subconjunt més adient a les tipologies de documentació a tractar. el disseny i programació del full d'estil SPS (StyleVision Power Stylesheet) utilitzat pereditar els continguts XML en un entorn visual gràfic que amaga les etiquetes i l'estructuraXML, i que facilita la edició mitjançant l'ús de formularis i càlculs automatitzats. el disseny i programació d'una sèrie de fulls d'estil XSL:FO (Extensible Style Language:Formatting Objects) per generar, a partir dels continguts XML, un únic document PDFamb alta qualitat d'impressió i aspecte visual professional. el disseny i programació d'una sèrie de fulls d'estil XSLT (Extensible Style LanguageTransformations) per generar, a partir dels continguts XML, un conjunt de pàgines webHTML.10Anahí Olives Ponsoda

L'esquema XSD obtingut i els fulls d'estil creats són adients per elaborar llibres digitals que podentambé incorporar objectes multimèdia. Algunes de les seves aplicacions podrien ser: Documentació per assignatures (apunts, problemes, pràctiques)Documentació institucional (pressupostos, memòries, informes)Memòries dels Projectes Finals de CarreraCol·leccions d'Edicions UPCEl fet de disposar dels continguts en format XML fa possible la modificació de l'estil utilitzat en elsseus formats de sortida d'una manera àgil i ràpida: només cal modificar els fulls d'estil necessarisi tornar a generar el document de sortida.Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria11

12Anahí Olives Ponsoda

2. Tecnologies XML utilitzadesAmb la finalitat d'introduir al lector en el món XML i facilitar el seguiment del desenvolupament delprojecte, a continuació es detallen les tecnologies XML que conforman la seva base. El diagramasegüent pot ajudar a entendre la relació que hi ha entre totes elles:2.1XML (Extensible Markup Language)Què és?XML és un llenguatge d'etiquetes que permet estructurar informació. És semblant a l'HTML, peròno és el mateix. En l'HTML, tant el conjunt d'etiquetes com la seva semàntica estan fixats. Uncontingut etiquetat com h1 és sempre un títol de primer nivell i una etiqueta com chapter noté cap sentit.L'W3C, juntament amb els fabricants de navegadors web i la comunitat WWW, treballaconstantment per estendre la definició de l'HTML afegint noves etiquetes per mantenir-se al diaSuport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria13

amb les tecnologies canviants i aportant variacions en la presentació de les pàgines a la Web. Noobstant, aquests canvis estan sempre rígidament limitats a allò que els fabricants haginimplementat.L'XML, en canvi, no especifica ni un conjunt d'etiquetes per defecte ni la seva semàntica. De fet,l'XML és en realitat un metallenguatge per descriure altres llenguatges d'etiquetes (per exemple:SVG, MathML, XSD, XSL, FO, etc.). En altres paraules, l'XML proporciona una manera per definiretiquetes i la relació estructural entre elles. Com que no hi ha un conjunt d'etiquetes predefinit, nohi pot haver cap semàntica preconcebuda. Tota la semàntica d'un document XML serà definidaper les aplicacions que el processin o pels fulls d'estil que el transformin en un format de sortida.Quin aspecte té?Els documents XML estan formats per etiquetes i continguts. Els principals tipus d'etiquetatge són: ElementsEls elements són la forma més comú d'etiqueta. Es delimiten pels caràcters i , i moltesvegades identifiquen la naturalesa del contingut que envolten. Alguns elements podenser buits, és a dir que no tenen contingut. Si un element no és buit, comença amb unaetiqueta d'inici element i acaba amb una etiqueta de fi /element . Per exemple:Aquesta notació es pot abreujar quan l'element és buit, ajuntant les etiquetes d'inici i fien una única etiqueta:es pot escriure tambéEls elements poden tenir atributs per proporcionar informació addicional. Els atributs sónparelles nom-valor que apareixen dins les etiquetes d'inici després del nom de l'element.14Anahí Olives Ponsoda

Per exemple, l'anterior és un element title que té un atribut anomenat id amb valor 4562.En XML, tots els valors d'atributs han d'anar entre cometes. Referències a entitatsEl fet d'afegir etiquetatge a un document, fa que alguns caràcters estiguin reservats peridentificar l'inici i final de les etiquetes. El signe , per exemple, identifica el començamentd'una etiqueta d'inici o fi. Per afegir aquests caràcters al document com a contingut, had'haver una manera alternativa de representar-los. En XML, la representació alternativasón les entitats.Cada entitat ha de tenir un nom únic que la identifiqui. Per utilitzar una entitat, simplementes referencia pel seu nom, col·locant abans un ampersand (&) i després un punt i coma(;). Per exemple, si dins el document XML es vol escriure el text A B, es pot fer com A< B. També es poden afegir caràcters arbitraris fent referència al seu codi Unicodedecimal o hexadecimal. Per exemple, el símbol de l'euro es pot escriure com & #8364;.Normalment, els editors XML actuals (com l'Editor de Materials Docents de la UPC)detecten els caràcters reservats i els converteixen a referències a entitatsautomàticament. ComentarisEls comentaris comencen amb els caràcters !-- i acaben amb -- i es poden ubicar aqualsevol lloc del document. Poden contenir qualsevol informació excepte la cadena --,ja que es detectaria com el final del comentari. No són part textual dels continguts deldocument, per la qual cosa, els processadors XML no cal que els tractin. Seccions CDATAEn un document XML, una secció CDATA indica al parser que ignori els caràctersd'etiquetatge. Entre l'inici de la secció, ![CDATA[, i el final de la secció, ]] , tots elscaràcters són passats directament a l'aplicació, sense interpretar-los. Els elements,entitats i comentaris no són reconeguts com a tals i els caràcters que els comprenen sónpassats literalment a l'aplicació. L'únic string que no pot aparèixer en una secció CDATAés ]] .Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria15

Per exemple, si el document XML conté:un cop processat el document s'obtindrà literalment el text: title El caràcter & /title Aquest tipus d'etiquetatge ha estat molt útil per emmagatzemar el text MathML d'unafórmula matemàtica. Aquest tema es tractarà a fons més endavant.Un exemple senzill seria el següent, corresponent a l'estructura bàsica d'un material docent delprojecte:16Anahí Olives Ponsoda

Espais de nomsUn espai de noms proporciona un mecanisme per anomenar de forma única els elements d'undocument XML. Un document XML pot contenir noms d'elements i atributs extrets de més d'unvocabulari XML.Per exemple, en el cas dels fulls d'estil XSL, on es fa referència tant a elements del vocabulariXSL com als de l'XML que es transforma. Si a cada vocabulari se li assigna un espai de noms,es resol l'ambigüitat entre noms d'elements idèntics. Tots els noms d'elements dins d'un espai denoms han de ser únics.Un espai de noms es declara utilitzant l'atribut reservat xmlns, el valor del qual ha de ser unaadreça URI (Uniform Resource Identifier). Per exemple:assigna l'URI http://www.w3.org/TR/WD-xsl a l'espai de noms xsl. Per utilitzar-lo només calcol·locar-lo com a prefix seguit de dos punts, en el nom d'una etiqueta, per exemple, xsl:template .Val a dir, que un parser no tracta aquesta URI com a una adreça web, sinó simplement com a unstring. Normalment, si s'introdueixen aquestes adreces en un navegador es mostren les pàginesweb de les recomanacions W3C respectives, però no contenen cap mena de codi, esquema ovocabulari que s'hagi d'utilitzar des de l'XML que el referencia.Utilitzar una URI (com http://www.w3.org/TR/WD-xsl) per identificar un espai de noms en lloc d'unsimple string (com podria ser xsl), redueix la possibilitat de duplicar identificadors per diferentsespais de noms. Encara que els identificadors no han de tenir format d'adreça web, en la majoriade casos es fa servir aquesta notació.Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria17

Estàndard W3CXML va ser definit inicialment l'any 1998 per l'XML Working Group del W3C (World Wide WebConsortium) i actualment es troba en la quarta edició, publicada l'agost del 2006.L'XML és un fitxer físic que conté totala informació introduïda per l'usuari.2.2XSD (XML Schema Definition)Què és?Un esquema és un model per descriure la estructura de la informació. És un terme prestat delmón de les bases de dades utilitzat per descriure la estructura de les dades en les taulesrelacionals. En el context de l'XML, un esquema descriu un model per a tota una classe dedocuments. El model descriu la possible col·locació de les etiquetes i el text en un document vàlid(més endavant es discutirà el significat de validesa en aquest context).Als esquemes, els models es descriuen en termes de restriccions. Una restricció defineix què potaparèixer en un context donat. Hi ha bàsicament dos tipus de restriccions: restriccions de contingut: descriuen l'ordre i seqüència d'aparició dels elementsrestriccions de tipus de dades: descriuen unitats d'informació vàlidesPer exemple, en l'esquema del projecte hi ha un element anomenat revision que s'utilitza perapuntar comentaris de l'autor durant l'edició del document. Aquest element té l'estructura següent:18Anahí Olives Ponsoda

Per a l'element revision , la restricció de contingut és que ha de consistir d'un únic element date seguit d'un únic element revdescription . A més, el contingut de l'element date , té unarestricció de tipus de dades que força a que tingui un format de data correcte.ValidesaEl propòsit d'un esquema és el de permetre la validació automàtica de l'estructura d'un document.Un document que no viola cap de les restriccions del model és, per definició, vàlid d'acord a aquellesquema.Utilitzant l'esquema descrit més amunt, un parser seria capaç de detectar que la següent revisióno és vàlida:pels motius següents:1.viola la restricció de contingut alterant la seqüència d'aparició dels elements. La formacorrecta seria que primer aparegués date i després revdescription .2.viola la restricció de contingut perquè no conté exactament un element revdescription .3.viola la restricció de tipus de dades per a l'element date ja que 30-02-2007 no és unadata correcta.Un exemple correcte per a aquest cas seria:Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria19

Un document és vàlid si s'ajusta al model descrit per a una classe de documents. Assegurar-sede la validesa d'un document XML és útil quan es pretén processar-lo amb un full d'estil per obtenirun format de sortida. Si es té la certesa que el full d'estil tracta totes les construccions vàlides del'esquema, es pot assegurar que els documents es processaran correctament si estan conformesamb l'esquema.A banda de que un document sigui vàlid, hi ha un primer nivell de comprovació per determinarque un document sigui sintàcticament correcte, és a dir, que estigui ben format. Tots elsdocuments poden ser catalogats en una de les següents formes:1.Si no està ben format, no és un XML. Per exemple, si hi ha alguna etiqueta oberta sensetancar.2.Si un document XML no té associat un esquema contra el que es pugui validar, llavorssimplement està ben format.3.Si un document XML té associat un esquema, i el document no s'ajusta al model descritper aquest esquema, llavors està ben format però no és vàlid.4.Si un document XML té associat un esquema, i el document no viola cap de lesrestriccions d'aquest esquema, llavors està ben format i és vàlid.XSD vs. DTDAbans de l'aparició dels esquemes XSD, el llenguatge d'esquema més comú era el DTD(Document Type Definition). El DTD també permet definir l'ordre i seqüència d'aparició delselements, però té una sèrie de limitacions que l'XSD supera sobradament.En el quadre següent es fa una comparativa de les respectives característiques:20Anahí Olives Ponsoda

DTDXSDEscrit amb una sintaxi pròpia (no XML).Escrit en XML.No suporta espais de noms.Suporta espais de noms.Ofereix tipus de dades extremadament limitats. Ofereix tipus de dades molt més rics: booleans,Només pot expressar el tipus de dades dels números, dates i hores, URIs, enters, númerosatributs en termes d'enumeracions i alguns decimals, números reals, intervals de temps,pocs formats d'string.etc. També permet la definició de tipus dedades d'usuari.S'ha d'escriure el codi directament.Amb la majoria d'editors XML, es pot crear demanera gràfica mentre l'editor genera el codinecessari automàticament.En conclusió, tenint en compte els avantatges proporcionats per l'XSD, en el projecte s'ha optatper utilitzar-lo en comptes del DTD.Quin aspecte té?Com s'ha dit abans l'XSD és un fitxer XML, amb la qual cosa la seva estructura serà la d'un arbred'etiquetes. Normalment, però, per crear i modificar els XSD es fan servir editors especialitzatsque permeten fer-ho de manera gràfica, molt més còmoda i menys propensa a errors que tractantamb el text directament.A forma d'exemple, a continuació es mostra el mateix fragment de l'XSD del projecte com a arbred'etiquetes:Suport a la edició de continguts XML DocBook i creació de fulls d'estil per a la generacióde sortides en múltiples formats. Memòria21

i com a esquema gràfic:22Anahí Olives Ponsoda

En l'annex A es reprodueix l'esquema XSD complet del projecte amb una petita explicació de lasimbologia que s'utilitza per descriure'l.Estàndard W3CL'XML Schema Working Grou

2.1 XML (Extensible Markup Language) 13 2.2 XSD (XML Schema Definition) 18 2.3 MathML (Mathematical Markup Language) 23 2.4 SPS (StyleVision Power Stylesheet) 25 2.5 XSL (Extensible Style Language) 27 2.6 XSLT (Extensible Style Language Transformations) 31 2.7 XSL:FO (Extensible Style Language: Formatting Objects) 32 2.8 XPath (XML Path Language) 33 3 Estudi de l'estàndard XML DocBook 37 3.1 .

Related Documents:

DND 04 formats in Ms. Word Engineering (ENG) 03 formats in Ms. Word Marketing (MKT) 05 formats in Ms. Word Operation (OPN) 15 formats in Ms. Word Services (SER) 03 formats in Ms. Word System (SYS) 17 formats in Ms. Word & Ms. Excel Training (TRG) 07 formats in Ms. Word 5. Standard Operating Procedures (SOPs) 06 SOPs in Ms. word 6. Process Flow .

HACCP Manual 05 chapter and 04 annexure in MS Word 2. Procedures 14 procedures in MS Word 3. HACCP docs. 18 files in MS Word 4. Formats 52 formats in MS Word Engineering (ENG) 06 formats in MS Word Purchase (PUR) 05 formats in MS Word Despatch (DES) 03 formats in MS Word Housekeeping (HKC) 09 formats in MS Word .

c smica, desde una perspectiva de m ltiples longitudes de onda. En particular, en la determinaci n de la densidad de las poblaciones de galaxias, en c mo y cu ndo se formaron las estrellas en las galaxias, y en c mo y cu ndo c

Data repositories often consist of text files in a wide variety of standard formats, ad-hoc formats, as well as mixtures of formats where data in one format is embedded into a different format. It is therefore a significant challenge to parse these files into a structured tabular form, which is important to enable any downstream data processing.

A: Sawmill can handle all major log formats and many minor formats, and you can create your own custom formats. For full details, see Supported Log Formats. Q: How is Sawmill different from other log analysis tools? A: Among other things, Sawmill does not generate static reports -- it generates dynamic, interlined reports. For full

LibreOffice File Formats Native document format is Open Document format (ODT, ODS, ODP, ODG - Text, Spreadsheet, Presentation, Graph) Supports other formats including MS Office Formats - Compatibility good but less than 100% Recent MS Office versions support LO File Formats - Compatibility good but less than 100% iPad/iPhone display LibreOffice ODT & ODP format

MANUAL EN DIALux PARA ILUMINACION GENERAL . Figura 11. Selecci on de material y color para paredes y piso. . Figura 18. Generaci on del PDF. 1Manual en DIALux para iluminaci on general realizado por Juliana G alvez Ram rez y Yara Luc a Arango Mar n. 13. 17. Al terminar de generar el PDF, aparece una ventana donde solicita la ubicaci on .

utilizaci n de herramientas de la Web 3.0 para mejorar el proceso de marcado y recuperaci n de los REAA. Los recursos digitales educativos, conocidos tambi n como objetos de aprendizaje [5], pueden ser una colecci n de contenidos, ejercitaciones y/o elementos de evaluaci n que se combinan de acuerdo a un