XML
XML
XML consiste en una serie de reglas, convenciones para planificar formatos texto para los datos
llamados “datos estructurados”, de manera que produzcan archivos que sean fácilmente
generados y leídos (por un ordenador) que son inequívocos, y que evitan escollos comunes
como la falta de extensibilidad, falta de soporte para la internacionalización o localismo, y la
dependencia de una determinada plataforma.
XSL es el lenguaje avanzado para explicitar hojas de estilo. Está basado en XSLT, un lenguaje
de transformación a menudo útil también fuera de XSL, para reordenar, añadir o borrar
etiquetas y atributos. El DOM es una serie de funciones estándar llamadas para manipular
archivos XML (y HTML) desde un lenguaje de programación. XML Namespaces es una
especificación que describe como puedes asociar una URL (dirección en la Web) con cada
etiqueta y atributo en un documento XML, si bien, para qué se utiliza la URL depende de la
aplicación que lea la URL. (RDF, el estándar del W3C para metadatos, lo usa para enlazar cada
metadato a un archivo definiendo el tipo de ese metadato.) XML Schemas 1 y 2 ayuda a los
desarrolladores a definir precisamente sus propios formatos basados en XML.
Las ventajas de un formato texto son evidentes (véanse las tres mencionadas arriba) y las
desventajas pueden ser, usualmente, compensadas en distintos niveles: El espacio en disco ya
no es tan caro como solía ser, además hay programas que comprimen archivos muy bien y muy
rápidamente (disponibles para casi todas las plataformas y son gratuitos). Además, los
protocolos de comunicación como los del modem y de HTTP/1.1 (el protocolo de la Web)
pueden comprimir datos en el momento de la transmisión economizando, de este modo, ancho
de banda tanto efectivamente como en un formato binario.
Los diseñadores de XML simplemente tomaron las mejores partes de SGML, guiados por la
experiencia con HTML, y produjeron algo que no es menos potente que SGML, pero bastante
más regular y simple de usar. Algunas evoluciones, sin embargo, son difíciles de distinguir de
las revoluciones... y hay que decir que mientras que SGML es ampliamente usado para
documentación técnica y mucho menos para otros tipos de datos, con XML ocurre exactamente
lo contrario.
La información que manejan las empresas es uno de sus principales activos. Pero lo normal es que esa
información esté fragmentada, en diferentes departamentos, ordenadores conectados o no, etc. El reto
ahora está en interrelacionar toda esa información para rendir todo su potencial y ponerlo a trabajar para
aumentar los beneficios o reducir los costes. Para realizar esto se necesita un estandar de almacenamiento
estructurado que es lo que nos ofrece XML.
Es un error es considerar a XML un HTML extendido (más avanzado). Pero todo el mundo lo que debería
preguntarse es qué es exactamente XML y qué aplicaciones tiene actualmente. Lo
que si tenemos más o menos claro es que XML es un lenguaje de Marcas, pero qué es exactamente un
lenguaje de marcas.
Conociendo este sistema y conociendo a la perfección el sistema de marcas de cada aplicación sería posible pasar información
de un sistema a otro sin necesidad de perder el formato indicado. La forma que IBM creó para solventar esto se basaba en tratar
las marcas como texto accesible desde cualquier sistema, texto plano, código ASCII. Y la norma se denominó GML (General
Modeling Language). Más tarde GML pasó a manos de ISO y se convirtio en SGML ( ISO 8879), Standart Generalized Markup
Language. Esta norma es la que se aplica desde entonces a todos los lenguajes de marcas, cuyos ejemplos más conocidos son el
HTML y el RTF.
Los lenguajes de marcas no son equivalentes a los lenguajes de programación aunque se definan igualmente como "lenguajes".
Son sistemas complejos de descripción de información, normalmente documentos, que si se ajustan a SGML, se pueden
controlar desde cualquier editor ASCII. Las marcas más utilizadas suelen describirse por textos descriptivos encerrados entre
corchetes agudos: (<) y (>).
Se puede decir que existen tres utilizaciones básicas de los lenguajes de marcas: los que sirven
principalmente para describir su contenido, los que sirven más que nada para definir su formato y los que
realizan las dos funciones indistintamente. Las aplicaciones de bases de datos son buenas referencias del
primer sistema, los programas de tratamiento de textos son ejemplos típicos del segundo tipo, y aunque no
lo parezca, el HTML es la muestra más conocida del tercer modelo.
¿Qué es XML?
XML (Extensible Markup Language) es un conjunto de reglas para definir etiquetas semánticas que nos
organizan un documento en diferentes partes. XML es un metalenguaje que define la sintaxis utilizada
para definir otros lenguajes de etiquetas estructurados.
En primer lugar para entenderlo bien hay que olvidarse un poco, sólo un poco de HTML.
En teoría HTML es un subconjunto de XML especializado en presentación de documentos para la Web,
mientras que XML es un subconjunto de SGML especializado en la gestión de información para la Web.
En la práctica XML contiene a HTML aunque no en su totalidad. La definición de HTML contenido
totalmente dentro de XML y por lo tanto que cumple a rajatabla la especificación SGML es XHTML
(Extensible, Hypertext Markup Language).
Desde su creación, XML ha despertado encontradas pasiones, y como para cualquier tema en Internet, hay gente que desde el
principio se deja iluminar por sus expectativas, mientras otras muchas lo han ignorado.
http://geneura.ugr.es/~maribel/xml/introduccion/index.shtml#1