Nota: Este documento es parte de una traducci�n al castellano de la Recomendaci�n del W3C "HTML 4.01 Specification" (m�s informaci�n). Puede consultar la versi�n original del mismo. Para cualquier comentario o correcci�n acerca de la traducci�n p�ngase en contacto con el traductor en jrpozo arroba conclase punto net. Gracias por su colaboraci�n.
V�ase el Aviso de copyright de la traducci�n.
Contenidos
Las siguientes secciones tratan sobre temas relativos a la estructuraci�n del texto. Los elementos relacionados con la presentaci�n del texto (elementos de alineaci�n, elementos de fuentes, hojas de estilo, etc.) se tratan en otros lugares de la especificaci�n. Para informaci�n sobre caracteres, consulte la secci�n sobre el conjunto de caracteres del documento.
El conjunto de caracteres del documento incluye una gran variedad de caracteres de espacio en blanco. Gran parte de ellos son elementos tipogr�ficos utilizados en algunas aplicaciones para producir ciertos efectos visuales de espaciado. En HTML, s�lo se definen como caracteres de espacio en blanco los siguientes:
Los saltos de l�nea tambi�n son caracteres de espacio en blanco. Obs�rvese que si bien la [ISO10646] define 
 y 
 como separaciones inequ�vocas de l�neas y p�rrafos respectivamente, estos caracteres no constituyen saltos de l�nea en HTML, y esta especificaci�n no los incluye en la categor�a general de caracteres de espacio en blanco.
Esta especificaci�n no indica el comportamiento, en cuanto a su representaci�n o a otros respectos, de otros caracteres de espacio que no sean los aqu� identificados expl�citamente como caracteres de espacio en blanco. Por esta raz�n, los autores deber�an utilizar los elementos y estilos apropiados, y no caracteres de espacio, para lograr efectos de formato visual relacionados con el espacio en blanco.
Para todos los elementos HTML, excepto para el elemento PRE, las secuencias de espacio en blanco separan "palabras" (con el t�rmino "palabra" queremos decir "secuencias de caracteres que no son de espacio en blanco"). Los agentes de usuario, al dar formato al texto, deber�an identificar estas palabras y mostrarlas de acuerdo con las convenciones del idioma escrito y del medio destino.
Esta presentaci�n puede implicar la colocaci�n de espacio entre palabras, pero las convenciones relativas al espacio var�an de un idioma a otr. Por ejemplo, en escritura latina, el espacio entre palabras se suele representar mediante un espacio ASCII ( ), mientras que en tailand�s se usa un separador de palabras de anchura cero (​). En japon�s y en chino el espacio entre palabras normalmente no se representa de ninguna manera.
Obs�rvese que una secuencia de espacios en blanco entre palabras en el documento fuente puede ser representada como un espacio entre palabras completamente diferente (excepto en el caso del elemento PRE). En particular, los agentes de usuario deber�an colapsar las secuencias de espacios en blanco de la entrada al producir la salida del espacio entre palabras. Esto puede y deber�a hacerse incluso en ausencia de informaci�n sobre el idioma (proveniente del atributo lang, el campo de encabezado HTTP "Content-Language" (ver [RFC2616], secci�n 14.12), la configuraci�n del agente de usuario, etc.).
El elemento PRE se utiliza para texto preformateado, en el cual el espacio en blanco es significativo.
Para evitar problemas con las reglas de saltos de l�nea de SGML e inconsistencias entre las implementaciones existentes, los autores no deber�an suponer que los agentes de usuario representar�n el espacio en blanco que est� inmediatamente despu�s de una etiqueta inicial o inmediatamente antes de una etiqueta final. As�, los autores, y en particular las herramientas de creaci�n, deber�an escribir:
<P>Ofrecemos <A>soporte t�cnico</A> gratuito a nuestros suscriptores.</P>
y no:
<P>Ofrecemos<A> soporte t�cnico </A>gratuito para nuestros suscriptores.</P>
<!ENTITY % phrase "EM | STRONG | DFN | CODE | SAMP | KBD | VAR | CITE | ABBR | ACRONYM" > <!ELEMENT (%fontstyle;|%phrase;) - - (%inline;)*> <!ATTLIST (%fontstyle;|%phrase;) %attrs; -- %coreattrs, %i18n, %events -- >
Etiqueta inicial: obligatoria, Etiqueta final: obligatoria
Atributos definidos en otros lugares
Los elementos de frase a�aden informaci�n estructural a fragmentos de texto. Los significados normales de los elementos de frase son los siguientes:
EM y STRONG se usan para indicar �nfasis. Los dem�s elementos de frase tienen significados particulares en documentos t�cnicos. Estos ejemplos ilustran algunos de los elementos de frase:
Como dijo <CITE>Harry S. Truman</CITE>, <Q lang="en-us">The buck stops here.</Q> Se puede encontrar m�s informaci�n en <CITE>[ISO-0000]</CITE>. Por favor, utilice el siguiente n�mero de referencia en nuestra correspondencia futura: <STRONG>1-234-55</STRONG>
La presentaci�n de los elementos de frase depende del agente de usuario. En general, los agentes de usuario presentan el texto EM en it�lica y el texto STRONG con una fuente negrita. Los sintetizadores de voz pueden cambiar los par�metros de s�ntesis, como el volumen, el tono y la velocidad.
Los elementos ABBR y ACRONYM permiten a los autores indicar claramente la aparici�n de abreviaturas y acr�nimos. Los idiomas occidentales hacen uso extensivo de acr�nimos tales como "GmbH", "NATO", y "F.B.I.", as� como de abreviaturas como "M.", "Inc.", "et al.", "etc.". Tanto en chino como en japon�s se utilizan mecanismos de abreviaci�n an�logos, por los cuales las referencias subsiguientes a un nombre largo se realizan con un subconjunto de los caracteres Han del nombre original. Al marcar estas estructuras se proporciona informaci�n �til a los agentes de usuario y a herramientas tales como correctores ortogr�ficos, sintetizadores de voz, sistemas de traducci�n e indexadores de motores de b�squeda.
El contenido de los elementos ABBR y ACRONYM especifica la expresi�n abreviada, tal y como aparece en el texto. Puede utilizarse el atributo title de estos elementos para proporcionar la forma completa o expandida de la expresi�n.
Aqu� tenemos algunos ejemplos de ABBR:
<P> <ABBR title="World Wide Web">WWW</ABBR> <ABBR lang="fr" title="Société Nationale des Chemins de Fer"> SNCF </ABBR> <ABBR lang="es" title="Doña">Doña</ABBR> <ABBR title="Abbreviation">abbr.</ABBR>
Obs�rvese que las abreviaturas y los acr�nimos tienen a menudo pronunciaciones idiosincr�ticas. Por ejemplo, mientras que "IRS" y "BBC" se suelen pronunciar letra por letra, "OTAN" y "UNESCO" se pronuncian fon�ticamente. Y hay otras formas abreviadas (p.ej., "URI" y "SCSI") que algunas personas deletrean y que otras pronuncian como palabras. Cuando sea necesario, los autores deber�an usar hojas de estilo para especificar la pronunciaci�n de una forma abreviada.
<!ELEMENT BLOCKQUOTE - - (%block;|SCRIPT)+ -- cita larga --> <!ATTLIST BLOCKQUOTE %attrs; -- %coreattrs, %i18n, %events -- cite %URI; #IMPLIED -- URI del documento o mensaje original -- > <!ELEMENT Q - - (%inline;)* -- cita corta en l�nea --> <!ATTLIST Q %attrs; -- %coreattrs, %i18n, %events -- cite %URI; #IMPLIED -- URI del documento o mensaje original -- >
Etiqueta inicial: obligatoria, Etiqueta final: obligatoria
Definiciones de atributos
Atributos definidos en otros lugares
Estos dos elementos designan citas de texto. BLOCKQUOTE es para citas largas (contenido en bloque) y Q sirve para citas cortas (contenido en l�nea) que no necesitan cambios de p�rrafo.
Este ejemplo da formato a un extracto de "The Two Towers", de J.R.R. Tolkien, como un cita en bloque.
<BLOCKQUOTE cite="http://www.micom.com/tolkien/twotowers.html"> <P>They went in single file, running like hounds on a strong scent, and an eager light was in their eyes. Nearly due west the broad swath of the marching Orcs tramped its ugly slot; the sweet grass of Rohan had been bruised and blackened as they passed.</P> </BLOCKQUOTE>
Los agentes de usuario visuales representan generalmente un BLOCKQUOTE como un bloque con sangr�a.
Los agentes de usuario visuales deben asegurarse de que el contenido del elemento Q se representa con marcas de citaci�n a su alrededor. Los autores no deber�an colocar marcas de citaci�n al principio y al final del contenido de un elemento Q.
Los agentes de usuario deber�an representar las marcas de citaci�n en funci�n del idioma (ver el atributo lang). Hay muchos idiomas que adoptan diferentes estilos de citaci�n para las citas externas y las internas (anidadas), lo cual deber�a ser respetado por los agentes de usuario.
El siguiente ejemplo ilustra las citas anidadas con el elemento Q.
John said, <Q lang="en-us">I saw Lucy at lunch, she told me <Q lang="en-us">Mary wants you to get some ice cream on your way home.</Q> I think I will get some at Ben and Jerry's, on Gloucester Road.</Q>
Como el idioma de ambas citas en ingl�s americano, los agentes de usuario deber�an representarlos de forma apropiada, por ejemplo, con comillas simples alrededor de la cita interior y con comillas dobles alrededor de la cita exterior:
John said, "I saw Lucy at lunch, she told me 'Mary wants you to get some ice cream on your way home.' I think I will get some at Ben and Jerry's, on Gloucester Road."
Nota. Recomendamos que las implementaciones de hojas de estilo porporcionen un mecanismo para insertar signos de puntuaci�n de citas antes y despu�s de una cita delimitada por un BLOCKQUOTE de un modo apropiado seg�n el contexto del idioma actual y el grado de anidamiento de las citas.
Sin embargo, debido a que algunos autores han usado BLOCKQUOTE simplemente como un mecanismo para dejar m�rgenes a los lados de un texto, y para preservar la intenci�n de los autores, los agentes de usuario no deber�an insertar signos de puntuaci�n de citas en el estilo por defecto.
El uso de BLOCKQUOTE para dar m�rgenes al texto est� desaprobado en favor de las hojas de estilo.
<!ELEMENT (SUB|SUP) - - (%inline;)* -- sub�ndice, super�ndice --> <!ATTLIST (SUB|SUP) %attrs; -- %coreattrs, %i18n, %events -- >
Etiqueta inicial: obligatoria, Etiqueta final: obligatoria
Atributos definidos en otros lugares
En muchos idiomas (p.ej., en franc�s) se necesitan los sub�ndices y los super�ndices para una representaci�n apropiada. En estos casos deber�an emplearse los elementos SUB y SUP.
H<sub>2</sub>O E = mc<sup>2</sup> <SPAN lang="fr">M<sup>lle</sup> Dupont</SPAN>
Tradicionalmente los autores dividen sus pensamientos y argumentos en secuencias de p�rrafos. La organizaci�n de la informaci�n en p�rrafos no se ve afectada por el modo en que se presentan los p�rrafos: los p�rrafos que est�n doblemente justificados contienen los mismos pensamientos que aquellos que est�n justificados a la izquierda.
La forma en que HTML define un p�rrafo es directa: el elemento P define un p�rrafo.
La presentaci�n visual de los p�rrafos no es tan simple. Hay que tener en cuenta varios aspectos, tanto estil�sticos como t�cnicos:
Todas estas cuestiones las tratamos a continuaci�n. La alineaci�n de p�rrafos y objetos flotantes se trata m�s adelante en este documento.
Etiqueta inicial: obligatoria, Etiqueta final: opcional
Atributos definidos en otros lugares
El elemento P representa un p�rrafo. No puede contener elementos en bloque (incluyendo a otros P).
Desaconsejamos a los autores el uso de elementos P vac�os. Los agentes de usuario no deber�an tener en cuenta los elementos P vac�os.
Un salto de l�nea se define como un retorno de carro (
), un avance de l�nea (
), o una pareja retorno de carro/avance de l�nea. Todos los saltos de l�nea constituyen espacio en blanco.
Para m�s informaci�n sobre la especificaci�n SGML en lo que se refiere a los saltos de l�nea, consulte las notas sobre los saltos de l�nea del ap�ndice.
<!ELEMENT BR - O EMPTY -- salto de l�nea forzado --> <!ATTLIST BR %coreattrs; -- id, class, style, title -- >
Etiqueta inicial: obligatoria, Etiqueta final: prohibida
Atributos definidos en otros lugares
El elemento BR rompe (finaliza) forzosamente la l�nea actual de texto.
Para agentes de usuario visuales, puede utilizarse el atributo clear para determinar si el c�digo que sigue al elemento BR fluye alrededor de las im�genes u otros objetos que est�n flotando en el margen izquierdo o derecho, o si comenzar� debajo de dichos objetos. Pueden encontrarse m�s detalles en la secci�n sobre alineaci�n y objetos flotantes. Se aconseja a los autores que usen hojas de estilo para controlar el flujo de texto alrededor de im�genes y otros objetos.
Con respecto al formato bidireccional, el elemento BR deber�a comportarse del mismo modo que se comporta el car�cter de [ISO10646] LINE SEPARATOR en el algoritmo bidireccional.
En algunas ocasiones los autores pueden querer evitar que se produzca un salto de l�nea entre dos palabras. La entidad (  o  ) act�a como un espacio en el cual los agentes de usuario no deber�an colocar un salto de l�nea.
En HTML hay dos tipos de guiones: el gui�n normal y el gui�n de separaci�n. El gui�n normal deber�a ser interpretado por un agente de usuario exactamente igual que cualquier otro car�cter. El gui�n de separaci�n le dice al agente de usuario d�nde puede producirse un salto de l�nea.
Aquellos navegadores que interpreten los guiones de separaci�n deben respetar la siguiente sem�ntica: Si una l�nea se rompe por un gui�n de separaci�n, debe mostrarse un gui�n al final de la primera l�nea. Si no se produce un salto de l�nea en un gui�n de separaci�n, el agente de usuario no debe mostrar el car�cter de gui�n. Para operaciones tales como b�squeda y ordenaci�n, el gui�n de separaci�n no deber�a ser tenido nunca en cuenta.
En HTML el gui�n normal se representa mediante el car�cter "-" (- o -). El gui�n de separaci�n se representa mediante la referencia a entidad de caracteres ­ (­ o ­)
<!ENTITY % pre.exclusion "IMG|OBJECT|BIG|SMALL|SUB|SUP"> <!ELEMENT PRE - - (%inline;)* -(%pre.exclusion;) -- texto preformateado --> <!ATTLIST PRE %attrs; -- %coreattrs, %i18n, %events -- >
Etiqueta inicial: obligatoria, Etiqueta final: obligatoria
Definiciones de atributos
Atributos definidos en otros lugares
El elemento PRE le dice a los agentes de usuario visuales que el texto contenido est� "preformateado". Al tratar con texto preformateado, los agentes de usuario visuales:
No es necesario que los agentes de usuario no visuales respeten el espacio en blanco adicional presente en el contenido de un elemento PRE.
Para m�s informaci�n sobre la especificaci�n SGML en lo que respecta a los saltos de l�nea, consulte las notas sobre los saltos de l�nea del ap�ndice.
El fragmento del DTD mostrado anteriormente indica qu� elementos no pueden aparecer dentro de una declaraci�n PRE. Son los mismos que en HTML 3.2, y la intenci�n es mantener constantes el espaciado de l�neas y la alineaci�n de columnas de texto representado con una fuente de ancho fijo. Se desaconseja a los autores alterar este comportamiento a trav�s de hojas de estilo.
El siguiente ejemplo muestra la primera estrofa preformateada del poema de Gabriel Celaya, A Pablo Neruda:
<PRE> Te escribo desde un puerto. La mar salvaje llora. Salvaje, y triste, y solo te escribo abandonado. Las olas funerales redoblan el vac�o. Los meg�fonos llaman a trav�s de la niebla. La p�lida corola de la lluvia me envuelve. Te escribo desolado. </PRE>
As� es como se representar�a esto en un caso t�pico:
Te escribo desde un puerto. La mar salvaje llora. Salvaje, y triste, y solo te escribo abandonado. Las olas funerales redoblan el vac�o. Los meg�fonos llaman a trav�s de la niebla. La p�lida corola de la lluvia me envuelve. Te escribo desolado.
El car�cter de tabulaci�n horizontal
Los agentes de usuario visuales suelen interpretar el car�cter de tabulaci�n horizontal (decimal 9 en [ISO10646] y
[ISO88591]) como el n�mero m�s peque�o distinto de cero de espacios necesarios para alinear los caracteres con las paradas del tabulador, colocadas cada 8 caracteres. Recomendamos encarecidamente no utilizar tabuladores horizontales en texto preformateado, ya que al editar es muy normal fijar el espacio de tabulaci�n en valores diferentes, lo cual conduce a documentos mal alineados.
Nota. La secci�n siguiente es una descripci�n informativa del comportamiento de algunos agentes de usuario visuales al dar formato a los p�rrafos. Las hojas de estilo tendr�n un control mejor sobre el formato de los p�rrafos.
El modo en que los p�rrafos se representan visualmente depende del agente de usuario. Normalmente los p�rrafos se representan alineados a la izquierda y sin alinear por la derecha. Para otras escrituras de derecha a izquierda son apropiadas otras presentaciones por defecto.
Los agentes de usuario HTML han representado tradicionalmente los p�rrafos con espacio en blanco antes y despu�s, p.ej.,
Segu�ale Sancho a pie, llevando, como ten�a de costumbre, del cabestro a su jumento, perpetuo compa�ero de sus pr�speras y adversas fortunas; y habiendo andado una buena pieza por entre aquellos casta�os y �rboles sombr�os, dieron en un pradillo que al pie de unas altas pe�as se hac�a, de las cuales se precipitaba un grand�simo golpe de agua. Al pie de las pe�as estaban unas casas mal hechas, que m�s parec�an ruinas de edificios que casas, de entre las cuales advirtieron que sal�a el ruido y estruendo de aquel golpear, que a�n no cesaba.
Esto contrasta con el estilo en las novelas, en las cuales la primera l�nea de cada p�rrafo tiene sangr�a, y entre la �ltima l�nea del p�rrafo actual y la primera del siguente se mantiene el espacio entre l�neas normal, p.ej.,
Segu�ale Sancho a pie, llevando, como ten�a de costumbre, del cabestro a su jumento, perpetuo compa�ero de sus pr�speras y adversas fortunas; y habiendo andado una buena pieza por entre aquellos casta�os y �rboles sombr�os, dieron en un pradillo que al pie de unas altas pe�as se hac�a, de las cuales se precipitaba un grand�simo golpe de agua. Al pie de las pe�as estaban unas casas mal hechas, que m�s parec�an ruinas de edificios que casas, de entre las cuales advirtieron que sal�a el ruido y estruendo de aquel golpear, que a�n no cesaba.
Los agentes de usuario, siguiendo el precedente sentado por el navegador NCSA Mosaic en 1993, no suelen justificar ambos m�rgenes, en parte porque es dif�cil de hacer sin sofisticadas rutinas de divisi�n de palabras. La llegada de las hojas de estilo y de las fuentes suavizadas con posicionamiento m�s preciso que el p�xel, promete a los autores HTML posibilidades m�s ricas de lo que lo han sido hasta ahora.
Las hojas de estilo proporcionan un mejor control sobre el tama�o y estilo de la fuente, los m�rgenes, los espacios antes y despu�s de los p�rrafos, la sangr�a de la primera l�nea, la justificaci�n, y otros muchos detalles. La hoja de estilo por defecto del agente de usuario representa los elementos P de una forma familiar, como se ilustra m�s arriba. Se podr�a, en principio, redefinir esto para representar los p�rrafos sin los espacios que separan convencionalmente los p�rrafos sucesivos. En general, como esto puede confundir a los lectores, desaconsejamos esta pr�ctica.
Convencionalmente, los agentes de usuario de HTML visuales ajustan autom�ticamente las l�neas de texto a la anchura disponible entre los m�rgenes. Los algoritmos de ajuste autom�tico de l�nea dependen del tipo de escritura a que se est� dando formato.
En las escrituras occidentales, por ejemplo, el texto s�lo deber�a partirse por un espacio en blanco. Los agentes de usuario antiguos part�an las l�neas incorrectamente justo despu�s de la etiqueta inicial o justo antes de la etiqueta final de un elemento, lo cual dejaba algunos signos de puntuaci�n colgados. Por ejemplo, consid�rese esta frase:
Una estatua de los <A href="cih78">Cihuateteus</A>, que son los patrones ...
Si se parte la l�nea justo antes de la etiqueta final del elemento A, la coma saldr� el comienzo de la siguiente l�nea:
Una estatua de los Cihuateteus , que son los patrones ...
Esto es un error, ya que no hab�a espacio en blanco en ese punto del c�digo.
<!-- INS/DEL se utilizan incluy�ndolos en BODY --> <!ELEMENT (INS|DEL) - - (%flow;)* -- texto insertado, texto borrado --> <!ATTLIST (INS|DEL) %attrs; -- %coreattrs, %i18n, %events -- cite %URI; #IMPLIED -- informaci�n sobre la raz�n del cambio -- datetime %Datetime; #IMPLIED -- fecha y hora del cambio -- >
Etiqueta inicial: obligatoria, Etiqueta final: obligatoria
Definiciones de atributos
Atributos definidos en otros lugares
INS y DEL se usan para marcar secciones del documento que han sido insertadas o borradas con respecto a una versi�n diferente de un documento (p.ej., en el borrador de una ley cuyos cambios necesitan ver los legisladores).
Estos dos elementos son especiales dentro de HTML, ya que pueden actuar o bien como elementos en bloque o bien como elementos en l�nea (pero no como ambos a la vez). Pueden contener una o m�s palabras dentro de un p�rrafo o uno o m�s elementos en bloque como p�rrafos, listas y tablas.
Este ejemplo podr�a estar sacado de una enmienda para cambiar la legislaci�n relativa a cu�ntos tenientes de alcalde puede haber en un Ayuntamiento determinado, de 8 a 9.
<P> El alcalde nombrar� a <DEL>8</DEL><INS>9</INS> tenientes de alcalde. </P>
Los elementos INS y DEL no deben contener contenido en bloque cuando estos elementos se comporten como elementos en l�nea.
EJEMPLO ILEGAL:
Lo siguiente no es HTML legal.
<P> <INS><DIV>...contenido en bloque...</DIV></INS> </P>
Los agentes de usuario deber�an representar el texto insertado y borrado de manera que los cambios sean obvios. Por ejemplo, el texto insertado pueden aparecer con una fuente especial, el texto borrado pueden no aparecer o aparecer tachado o con marcas especiales, etc.
Estos dos ejemplos corresponden al 5 de noviembre de 1994, a las 8:15:30 am, US Eastern Standard Time.
1994-11-05T13:15:30Z 1994-11-05T08:15:30-05:00
Con un elemento INS, esto da:
<INS datetime="1994-11-05T08:15:30-05:00" cite="http://www.blabla.org/midoc/comentarios.html"> Adem�s, las �ltimas estad�sticas del departamento de publicidad sugieren que estas pr�cticas est�n en alza. </INS>
El documento "http://www.blabla.org/midoc/comentarios.html" contendr�a comentarios sobre por qu� se incluy� la informaci�n en el documento.
Los autores tambi�n pueden optar por comentar los textos insertados o borrados por medio del atributo title de los elementos INS y DEL. Los agentes de usuario pueden presentar esta informaci�n a los usuarios (p.ej., con un nota flotante). Por ejemplo:
<INS datetime="1994-11-05T08:15:30-05:00" title="Cambiado tras los comentarios de Steve B en la reuni�n."> Adem�s, las �ltimas estad�sticas del departamento de publicidad sugieren que estas pr�cticas est�n en alza. </INS>