1.3.1 HTML como un tipo SGML

SGML son las siglas de «Standard Generalized Markup Language» o «Lenguaje de Marcación Generalizado». Consiste en un sistema para la organización y etiquetado de documentos. La Organización Internacional de Estándares (ISO) ha normalizado este lenguaje en 1986.

El lenguaje SGML sirve para especificar las reglas de etiquetado de documentos y no impone en sí algún conjunto de etiquetas en especial. El lenguaje HTML es un subconjunto de SGML, que es un estándar de descripción de página independiente del dispositivo, lo que permite adaptar la visión del documento al tamaño de la pantalla en la que se muestra.

En un documento HTML hay etiquetas que indican los atributos del texto (negrita, centrado…). Otras indican al sistema cómo debe responder a eventos que genere el usuario, por ejemplo, que después de que el usuario señale con el ratón un icono que representa una película, se ejecute el programa que reproduce vídeo en formato digital.

La etiqueta más importante es la que indica un vínculo, que puede contener como destinatario otro lugar del mismo documento o el URL de otro documento; este último puede residir en el mismo lugar de la Web que el documento actual o en cualquier otra computadora de WWW. A medida que se ha ido avanzando, se han estandarizado distintas versiones del lenguaje HTML. Cada una de ellas amplía el número de etiquetas, lo que permite nuevas posibilidades para los documentos; así, se le ha dotado de marcas para rellenar formularios (forms) de manera interactiva, que permiten al usuario enviar la información necesaria para realizar consultas en bases de datos, comprar o solicitar un servicio.

Otras marcas permiten mejorar la presentación de los documentos, por ejemplo, añadiendo fondos, tablas de contenido o textos intermitentes. La versión HTML 4.0 se utiliza en combinación con el XML 1.0, otro subconjunto de SGML que permite al desarrollador definir sus propias etiquetas; el resultado es un nuevo formato denominado XHTML, que se espera que constituya un nuevo estándar de formato para páginas Web. Su principal ventaja estriba en que va a permitir desarrollar páginas Web con diferentes conjuntos de datos, que se podrían descargar en dispositivos de mano, con pantallas de tamaño reducido.

El software que permite al usuario consultar documentos en World Wide Web se denomina explorador o navegador; los más conocidos son Netscape Navigator y Microsoft Internet Explorer. Se encarga de interpretar las etiquetas y de mostrar el documento en la pantalla.

La evolución de las distintas versiones del lenguaje HTML ha estado determinada por un desarrollo paralelo de los navegadores, que permitiese interpretar las nuevas etiquetas. El avance de unos y otros ha contribuido al crecimiento exponencial que ha experimentado WWW.

Una definición del tipo de documento SGML declara tipos de elementos que representan estructuras o un comportamiento deseado. HTML incluye elementos que representan párrafos, vínculos de hipertexto, listas, tablas, imágenes, etc.

Cada declaración de tipo de elemento describe generalmente tres partes: una etiqueta inicial, un contenido y una etiqueta final.

El nombre del elemento aparece en la etiqueta inicial (<nombre-del-elemento>)       y en la etiqueta final (</nombre-del-elemento>); en la etiqueta final muestra una barra que precede al nombre del elemento para indicar que es el cierre de la etiqueta.

Los elementos pueden tener propiedades asociadas, llamadas atributos, que pueden tener valores (por default o asignados por el autor o por un script). Las parejas atributo/valor aparecen antes del  final de la etiqueta inicial de un elemento. En la etiqueta inicial de un elemento puede aparecer cualquier número de parejas atributo/valor, separadas por espacios. Pueden aparecer en cualquier orden.

Por default, SGML requiere que todos los valores de atributo estén delimitados ya sea mediante comillas dobles (ASCII decimal 34) o mediante comillas simples (ASCII decimal 39).  El valor del atributo sólo puede contener letras (a-z y A-Z), dígitos (0-9), guiones (ASCII decimal 45), puntos (ASCII decimal 46), subguiones (ASCII decimal 95) y dos puntos (ASCII decimal 58).  Para los nombres de atributos no se distingue nunca entre mayúsculas y minúsculas. Para los valores de los atributos en general no se distingue entre mayúsculas y minúsculas.

Deja un comentario