0% encontró este documento útil (0 votos)
233 vistas

XML

XML permite introducir datos estructurados en archivos de texto mediante etiquetas. A diferencia de HTML, donde las etiquetas definen el formato, en XML las etiquetas solo delimitan los datos y su interpretación depende de la aplicación. XML es más estricto que HTML pero ofrece ventajas como portabilidad e independencia de plataformas. XML consiste en una familia de tecnologías como XSLT para transformar documentos XML.

Cargado por

api-3729695
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
233 vistas

XML

XML permite introducir datos estructurados en archivos de texto mediante etiquetas. A diferencia de HTML, donde las etiquetas definen el formato, en XML las etiquetas solo delimitan los datos y su interpretación depende de la aplicación. XML es más estricto que HTML pero ofrece ventajas como portabilidad e independencia de plataformas. XML consiste en una familia de tecnologías como XSLT para transformar documentos XML.

Cargado por

api-3729695
Derechos de autor
© Attribution Non-Commercial (BY-NC)
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 4

1.

XML es un método para introducir datos estructurados en un fichero de texto

XML consiste en una serie de reglas, convenciones para planificar formatos texto para los datos
llamados “datos estructurados”, de manera que produzcan archivos que sean fácilmente
generados y leídos (por un ordenador) que son inequívocos, y que evitan escollos comunes
como la falta de extensibilidad, falta de soporte para la internacionalización o localismo, y la
dependencia de una determinada plataforma.

2. XML se parece al HTML pero no es HTML


Al igual que el HTML el XML utiliza tags (etiquetas), pero mientras que HTML especifica lo que
c/ etiqueta y atributo significan (frecuentemente la apariencia en un navegador).
XML usa las etiquetas sólo para delimitar piezas de datos, y deja la interpretación de los datos,
completamente, a la aplicación que los lee.
En otras palabras, si ves "<p>" en un fichero XML, no supongas que se trata de un párrafo,
dependiendo del contexto, puede tratarse de un precio, un parámetro, una persona, un p... (A
propósito, ¿quien ha dicho que debe ser una palabra que empiece por "p"?)

3. XML es archivo de texto, pero no para ser leído


Los archivos XML son hasta más difíciles de leer por los humanos que los archivos HTML. Son
archivos de texto, porque permiten a los expertos (programadores) depurar errores en las
aplicaciones, más fácilmente, y en casos de emergencia, pueden usar un simple editor de
textos para arreglar un archivo XML estropeado. Pero las reglas para los archivos XML son más
estrictas que para los archivos HTML (el olvido de una etiqueta, o un atributo sin comillas,
hacen que el archivo sea inservible. HTML al menos las tolera).
Está escrito en la especificación oficial de XML: No le está permitido a las aplicaciones intentar
justificar al creador de un archivo XML dañado; si el archivo está dañado, la aplicación debe
detenerse inmediatamente y emitir un error.

4. XML es una familia de tecnologías


Existe XML 1.0, la especificación que define cuales son las "tags" (etiquetas) y "atributos", pero
alrededor de XML 1.0 hay una creciente serie de módulos opcionales que ofrecen colecciones
de etiquetas y atributos, o pautas para especificar tareas. Existe, por ejemplo, Xlink (aún en
desarrollo desde noviembre de 1999) que describe una manera estándar de añadir hiper-
enlaces a un archivo XML. XPointer y XFragments (también aún en desarrollo) son sintaxis
para apuntar a partes de un documento XML. (Un Xpointer es parecido a una URL, pero en vez
de apuntar a documentos en la Web, apunta a fragmentos de datos en un archivo XML.) CSS,
el lenguaje de hojas de estilo, se puede aplicar a XML igual que a HTML.

XSL es el lenguaje avanzado para explicitar hojas de estilo. Está basado en XSLT, un lenguaje
de transformación a menudo útil también fuera de XSL, para reordenar, añadir o borrar
etiquetas y atributos. El DOM es una serie de funciones estándar llamadas para manipular
archivos XML (y HTML) desde un lenguaje de programación. XML Namespaces es una
especificación que describe como puedes asociar una URL (dirección en la Web) con cada
etiqueta y atributo en un documento XML, si bien, para qué se utiliza la URL depende de la
aplicación que lea la URL. (RDF, el estándar del W3C para metadatos, lo usa para enlazar cada
metadato a un archivo definiendo el tipo de ese metadato.) XML Schemas 1 y 2 ayuda a los
desarrolladores a definir precisamente sus propios formatos basados en XML.

5. XML es prolijo, pero eso no es un problema


Puesto que XML es un formato texto y que usa etiquetas para delimitar los datos, los archivos
XML son casi siempre comparablemente mayores que los formatos binarios. Está fue una
decisión tomada conscientemente por los desarrolladores de XML.

Las ventajas de un formato texto son evidentes (véanse las tres mencionadas arriba) y las
desventajas pueden ser, usualmente, compensadas en distintos niveles: El espacio en disco ya
no es tan caro como solía ser, además hay programas que comprimen archivos muy bien y muy
rápidamente (disponibles para casi todas las plataformas y son gratuitos). Además, los
protocolos de comunicación como los del modem y de HTTP/1.1 (el protocolo de la Web)
pueden comprimir datos en el momento de la transmisión economizando, de este modo, ancho
de banda tanto efectivamente como en un formato binario.

6. XML es nuevo, pero no tan nuevo


Antes del XML(1998) existía el SGML(86’), ampliamente utilizado para grandes proyectos de
documentación. Y por supuesto HTML(1990).

Los diseñadores de XML simplemente tomaron las mejores partes de SGML, guiados por la
experiencia con HTML, y produjeron algo que no es menos potente que SGML, pero bastante
más regular y simple de usar. Algunas evoluciones, sin embargo, son difíciles de distinguir de
las revoluciones... y hay que decir que mientras que SGML es ampliamente usado para
documentación técnica y mucho menos para otros tipos de datos, con XML ocurre exactamente
lo contrario.

7. XML es gratis, independiente de la plataforma y ampliamente


distribuida
Eligiendo XML como base para algún proyecto tienes a tu disposición una gran y creciente
comunidad de herramientas e ingenieros experimentados en la tecnología. Optar por XML es
parecido a elegir SQL para las bases de datos: aún debes construir tu propia base de datos y
tus propios procedimientos y/o programas para manipularla, pero hay muchas herramientas
disponibles y mucha gente que puede ayudarte. Y puesto que XML es una tecnología W3C, es
gratis.

XML no siempre es la mejor solución, pero siempre merece ser considerada.


.- Vista general de XML
El código html permite insertar menús, tablas, imágenes o bases de datos en los documentos, pero no
permite al usuario que maneje esos elementos como mejor le convenga (ordenar o actualizarlos los datos
en tiempo real o realizar un pedido) con la poderosa ayuda del ordenador. Esa es la principal novedad que
XML aporta.

La información que manejan las empresas es uno de sus principales activos. Pero lo normal es que esa
información esté fragmentada, en diferentes departamentos, ordenadores conectados o no, etc. El reto
ahora está en interrelacionar toda esa información para rendir todo su potencial y ponerlo a trabajar para
aumentar los beneficios o reducir los costes. Para realizar esto se necesita un estandar de almacenamiento
estructurado que es lo que nos ofrece XML.

Es un error es considerar a XML un HTML extendido (más avanzado). Pero todo el mundo lo que debería
preguntarse es qué es exactamente XML y qué aplicaciones tiene actualmente. Lo
que si tenemos más o menos claro es que XML es un lenguaje de Marcas, pero qué es exactamente un
lenguaje de marcas.

1.1.- Lenguajes de Marcas


En los años 60, IBM intentó resolver sus problemas asociados al tratamiento de documentos en diferentes plataformas a través
de GML (Generalized markup Language). El principal problema era que cada aplicación utilizaba sus propias marcas para
describir los diferentes elementos. Las marcas son códigos que indican a un programa cómo debe tratar su contenido y así, si se
desea que un texto aparezca con un formato determinado, dicho texto debe ir delimitado por la correspondiente marca que
indique como debe ser mostrado en pantalla o impreso.

Conociendo este sistema y conociendo a la perfección el sistema de marcas de cada aplicación sería posible pasar información
de un sistema a otro sin necesidad de perder el formato indicado. La forma que IBM creó para solventar esto se basaba en tratar
las marcas como texto accesible desde cualquier sistema, texto plano, código ASCII. Y la norma se denominó GML (General
Modeling Language). Más tarde GML pasó a manos de ISO y se convirtio en SGML ( ISO 8879), Standart Generalized Markup
Language. Esta norma es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos más conocidos son el
HTML y el RTF.

Los lenguajes de marcas no son equivalentes a los lenguajes de programación aunque se definan igualmente como "lenguajes".
Son sistemas complejos de descripción de información, normalmente documentos, que si se ajustan a SGML, se pueden
controlar desde cualquier editor ASCII. Las marcas más utilizadas suelen describirse por textos descriptivos encerrados entre
corchetes agudos: (<) y (>).

Se puede decir que existen tres utilizaciones básicas de los lenguajes de marcas: los que sirven
principalmente para describir su contenido, los que sirven más que nada para definir su formato y los que
realizan las dos funciones indistintamente. Las aplicaciones de bases de datos son buenas referencias del
primer sistema, los programas de tratamiento de textos son ejemplos típicos del segundo tipo, y aunque no
lo parezca, el HTML es la muestra más conocida del tercer modelo.

¿Qué es XML?
XML (Extensible Markup Language) es un conjunto de reglas para definir etiquetas semánticas que nos
organizan un documento en diferentes partes. XML es un metalenguaje que define la sintaxis utilizada
para definir otros lenguajes de etiquetas estructurados.

En primer lugar para entenderlo bien hay que olvidarse un poco, sólo un poco de HTML.
En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web,
mientras que XML es un subconjunto de SGML especializado en la gestión de información para la Web.
En la práctica XML contiene a HTML aunque no en su totalidad. La definición de HTML contenido
totalmente dentro de XML y por lo tanto que cumple a rajatabla la especificación SGML es XHTML
(Extensible, Hypertext Markup Language).

Desde su creación, XML ha despertado encontradas pasiones, y como para cualquier tema en Internet, hay gente que desde el
principio se deja iluminar por sus expectativas, mientras otras muchas lo han ignorado.

http://geneura.ugr.es/~maribel/xml/introduccion/index.shtml#1

También podría gustarte