Protocolo HTTP PDF
Protocolo HTTP PDF
Protocolo HTTP
Indice
World Wide Web ......................................................................................................................... 6
Funcionamiento de la Web ..................................................................................................... 6
Estándares Web ....................................................................................................................... 6
¿Qué son los Estándares Web? ................................................................................................. 7
¿Para qué sirven? ...................................................................................................................... 8
Acceso Universal ................................................................................................................... 8
Una Web con significado ....................................................................................................... 9
Confianza en la Web.............................................................................................................. 9
¿Cómo funcionan? .................................................................................................................. 10
Ejemplos .................................................................................................................................. 11
HTML ................................................................................................................................... 11
XML...................................................................................................................................... 11
Características generales de un servicio Web. ............................................................................ 12
¿Qué son los Servicios Web?................................................................................................... 12
¿Para qué sirven? .................................................................................................................... 12
- Componentes y funcionamiento. ¿Cómo funcionan? .............................................................. 12
Nombres y direcciones (URIs y URLs)...................................................................................... 14
¿Qué es un URL? ..................................................................................................................... 15
¿Cuál es la diferencia entre URL y URI? .................................................................................. 15
Páginas web............................................................................................................................. 15
Características ..................................................................................................................... 15
Sitios Web................................................................................................................................ 16
Diferencia entre sitio web y página web ................................................................................. 17
Aplicación Web........................................................................................................................ 17
Ejemplos de aplicaciones web............................................................................................. 17
Protocolo HTTP............................................................................................................................ 18
Funcionamiento básico. .......................................................................................................... 18
Los mensajes HTTP .................................................................................................................. 19
Un mensaje de petición....................................................................................................... 19
Un mensaje de respuesta ........................................................................................................ 20
2
Protocolo HTTP
3
Protocolo HTTP
4
Protocolo HTTP
5
Protocolo HTTP
La Web fue creada alrededor de 1989 por el inglés Tim Berners-Lee y el belga Robert Cailliau
mientras trabajaban en el CERN en Ginebra, Suiza, y publicado en 1992. Desde entonces,
Berners-Lee ha jugado un papel activo guiando el desarrollo de estándares Web (como los
lenguajes de marcado con los que se crean las páginas web), y en los últimos años ha abogado
por su visión de una Web semántica.
Funcionamiento de la Web
El primer paso consiste en traducir la parte nombre del servidor de la URL en una dirección IP
usando la base de datos distribuida de Internet conocida como DNS. Esta dirección IP es
necesaria para contactar con el servidor web y poder enviarle paquetes de datos.
El siguiente paso es enviar una petición HTTP al servidor Web solicitando el recurso. En el caso
de una página web típica, primero se solicita el texto HTML y luego es inmediatamente
analizado por el navegador, el cual, después, hace peticiones adicionales para los gráficos y
otros ficheros que formen parte de la página. Las estadísticas de popularidad de un sitio web
normalmente están basadas en el número de páginas vistas o las peticiones de servidor
asociadas, o peticiones de fichero, que tienen lugar.
Al recibir los ficheros solicitados desde el servidor web, el navegador renderiza la página tal y
como se describe en el código HTML, el CSS y otros lenguajes web. Al final se incorporan las
imágenes y otros recursos para producir la página que ve el usuario en su pantalla.
Estándares Web
6
Protocolo HTTP
Berners Lee dirige desde 2007 el World Wide Web Consortium (W3C), el cual desarrolla y
mantiene esos y otros estándares que permiten a los ordenadores de la Web almacenar y
comunicar efectivamente diferentes formas de información.
En la creación de las Recomendaciones del W3C participan sus Miembros (más de 400
organizaciones, distribuidas a lo largo de todo el mundo y de diversos ámbitos:
grandes empresas de hardware o software, centros investigadores, universidades,
administraciones públicas, etc.), el Equipo del W3C, expertos invitados, y cualquier
usuario de la Web que quiera mostrar su opinión. Todos ellos trabajan conjuntamente
a través de un proceso basado en el consenso, la neutralidad y la transparencia de la
información.
7
Protocolo HTTP
Algunos de los estándares Web más conocidos y ampliamente utilizados son: HTML
(HyperText Markup Language), para definir la estructura de los documentos; XML
(eXtensible Markup Language), que sirve de base para un gran número de tecnologías;
y CSS (Cascading Style Sheets), que permite asignar estilos para la representación de
los documentos.
Acceso Universal
8
Protocolo HTTP
El avance de las tecnologías inalámbricas, así como la gran variedad de dispositivos con
acceso a la Web presentes en sectores como el de la telefonía móvil, en el de
automoción (navegadores en los salpicaderos de automóviles), en los
electrodomésticos (refrigeradores con pantallas táctiles) o en los televisores, fomenta
la ubicuidad de la Web. Esto pone de manifiesto la necesidad de utilizar tecnologías y
lenguajes unificados, libres y gratuitos, cuyo uso no esté limitado por patentes
comerciales.
Confianza en la Web
Estas actividades requieren que los usuarios confíen entre sí y han promovido el
desarrollo de ciertas tecnologías para asegurar esta confianza: firmas digitales de
documentos que fomentan la responsabilidad de las personas que se declaran autores
de estos; encriptación de los datos para la confidencialidad; y mecanismos de
9
Protocolo HTTP
¿Cómo funcionan?
Estos estándares, están sujetos a la Política de Patentes del W3C, lo que permite que
sean utilizados libremente por toda la comunidad Web. Al utilizar las mismas
tecnologías, las máquinas se entienden entre sí y cualquier usuario puede interactuar
con el resto.
Para ayudar a los desarrolladores que deseen utilizar sus Recomendaciones, el W3C
ofrece una serie de herramientas que permiten verificar si se hace una correcta
aplicación de las especificaciones. Manuales de directivas o buenas prácticas de
10
Protocolo HTTP
Ejemplos
HTML
XML
11
Protocolo HTTP
Según el ejemplo del gráfico, un usuario (que juega el papel de cliente dentro de
los Servicios Web), a través de una aplicación, solicita información sobre un viaje
que desea realizar haciendo una petición a una agencia de viajes que ofrece
sus servicios a través de Internet. La agencia de viajes ofrecerá a su cliente
(usuario) la información requerida. Para proporcionar al cliente la información
que necesita, esta agencia de viajes solicita a su vez información a otros recursos
(otros Servicios Web) en relación con el hotel y la compañía aérea. La agencia de
viajes obtendrá información de estos recursos, lo que la convierte a su vez en
12
Protocolo HTTP
Por otro lado, WSDL (Lenguaje de Descripción de Servicios Web), permite que un
servicio y un cliente establezcan un acuerdo en lo que se refiere a los detalles de
transporte de mensajes y su contenido, a través de un documento procesable
por dispositivos. WSDL representa una especie de contrato entre el proveedor y
el que solicita. WSDL especifica la sintaxis y los mecanismos de intercambio de
mensajes.
13
Protocolo HTTP
NOMBRES, DIRECCIONES
Se dice que un nombre está resuelto cuando está traducido a datos relacionados con el
recurso en cuestión. La asociación entre un nombre y un objeto se llama enlace. Los
nombres suelen enlazarse a los atributos de los objetos y no a su implementación. Un
atributo es una propiedad de un objeto.
Identificadores de Recurso Unificados (URI): Un ejemplo de URI son los URL, que
son direcciones únicamente de recursos web, a los que se puede acceder con facilidad
(nombre DNS más un camino hacia el recurso). Pero si un recurso se mueve o se borra,
el URL no apuntará a nada (se dice comúnmente que está roto) o apuntará a otro
objeto (si ha sido referenciado igual que el anterior).
Otro tipo de URI son los Nombres Uniformes de Recurso (URN), que tratan de resolver
los anteriores problemas. Un servicio de búsqueda URN relaciona los URN con su URL
correspondiente, la cual puede variar en el tiempo (sin que varíe el URN). Si un
administrador cambia la URL, debe registrar la nueva en el servicio de búsqueda.
URIs relativas
Las URIs relativas son URIs parciales, utilizadas para referirse a un documento desde
otro en la misma computadora. De esta forma, podemos definir una URI relativa como
la ruta que se debe seguir desde la ubicación del documento actual (ruta de
directorios) a la ubicación del recurso referido, además del nombre de archivo.
14
Protocolo HTTP
El directorio especial ".." provee una forma de ir hacia atrás al directorio "padre". De
modo que para apuntar desde
"http://nuevoservidor.mil/documentos/nuevos/mejores/rec.htm" a
"http://nuevoservidor.mil/documentos/antiguos/mejores/junio.htm", la URI relativa
será: "../../antiguos/mejores/junio.htm"
¿Qué es un URL?
Los URLs (Uniform Resource Locator) son identificadores que permiten acceder a
recursos (páginas) web. En la misma forma en que los humanos utilizamos direcciones
para identificar y encontrar ubicaciones, los URLs le sirven al navegador (y otros
sistemas) para encontrar una página o recurso Web en el vasto mundo del Internet.
Páginas web
Características
Una página web está compuesta principalmente por información (sólo texto y/o
módulos multimedia) así como por hiperenlaces; además puede contener o asociar
15
Protocolo HTTP
Las páginas web son escritas en un lenguaje de marcado que provee la capacidad de
manejar e insertar hiperenlaces, generalmente HTML.
Las páginas dinámicas que se generan, al ser solicitadas, son creadas por una
aplicación en el servidor web que alberga las mismas.
Sitios Web.
En inglés website o web site, un sitio web es un sitio (localización) en la World Wide
Web que contine documentos (páginas web) organizados gerárquicamente. Cada
documento (página web) contiene texto y o gráficos que aparecen como información
digital en la pantalla de un ordenador. Un sitio puede contener una combinación de
gráficos, texto, audio, vídeo, y otros materiales dinámicos o estáticos.
Cada sitio web tiene una página de inicio (en inglés Home Page), que es el primer
documento que ve el usuario cuando entra en el sitio web poniendo el nombre del
dominio de ese sitio web en un navegador. El sitio normalmente tiene otros
16
Protocolo HTTP
A veces se utiliza erróneamente el término página web para referirse a sitio web. Una
página web es parte de un sitio web y es un único archivo con un nombre de archivo
asignado, mientras que un sitio web es un conjunto de archivos llamados páginas web.
Si lo comparáramos con un libro, un sitio web sería el libro entero y una página web de
ese sitio web sería un capítulo de ese libro. El título del libro sería el nombre del
dominio del sitio web. Un capítulo, al igual que una página web, tiene un nombre que
lo define. Decimos que sería un capítulo y no una página del libro porque a menudo es
necesario desplazarse hacia bajo en la pantalla para ver todo el contenido de una
página web, al igual que en un libro te desplazas a través de varias páginas para ver
todo el contenido de un capítulo. El índice de los capítulos del libro sería el equivalente
al mapa del sitio web (sitemap en inglés).
Aplicación Web
Una aplicación web es cualquier aplicación que es accedida vía web por una red como
internet o una intranet.
Una de las ventajas de las aplicaciones web cargadas desde internet (u otra red) es la
facilidad de mantener y actualizar dichas aplicaciones sin la necesidad de distribuir e
instalar un software en, potencialmente, miles de clientes. También la posibilidad de
ser ejecutadas en múltiples plataformas.
Las aplicaciones web son utilizadas para implementar webmail, ventas online, subastas
17
Protocolo HTTP
online, wikis, foros de discusión, weblogs, MMORPGs, redes sociales, juegos, etc.
Protocolo HTTP
Desde el punto de vista de las comunicaciones, está soportado sobre los servicios de
conexión TCP/IP, y funciona de la misma forma que el resto de los servicios comunes
de los entornos UNIX: un proceso servidor escucha en un puerto de comunicaciones
TCP (por defecto, el 80), y espera las solicitudes de conexión de los clientes Web. Una
vez que se establece la conexión, el protocolo TCP se encarga de mantener la
comunicación y garantizar un intercambio de datos libre de errores.
Funcionamiento básico.
Cada vez que un cliente realiza una petición a un servidor, se ejecutan los siguientes
pasos:
18
Protocolo HTTP
Un mensaje de petición
19
Protocolo HTTP
HTTP/1.1 200 OK
Cache-control: private
Un mensaje de respuesta
Content-Type: text/html
Content-Encoding: gzip
Server: GWS/2.1
Content-length: 1484
Código Significado
200 OK Petición exitosa
301 Moved Permanently El objeto demandado ha sido movido
a la URL especificada en Location:
400 Bad Request Petición no entendida por el servidor
404 Not Found Objeto no encontrado en el servidor
505 HTTP Version Not Supported Obvio
20
Protocolo HTTP
Métodos de petición
Método Significado
GET Devuelve el recurso identificado en
la URL pedida.
HEAD Funciona como el GET, pero sin que
el servidor devuelva el cuerpo del
mensaje. Es decir, sólo se devuelve
la información de cabecera.
POST Indica al servidor que se prepare
para recibir información del cliente.
Suele usarse para enviar
información desde formularios.
PUT Envía el recurso identificado en la
URL desde el cliente hacia el
servidor.
OPTIONS Pide información sobre las
características de comunicación
proporcionadas por el servidor. Le
permite al cliente negociar los
parámetros de comunicación.
TRACE Inicia un ciclo de mensajes de
petición. Se usa para depuración y
permite al cliente ver lo que el
servidor recibe en el otro lado.
DELETE Solicita al servidor que borre el
recurso identificado con el URL.
CONNECT Este método se reserva para uso
con proxys. Permitirá que un proxy
pueda dinámicamente convertirse
en un túnel. Por ejemplo para
comunicaciones con SSL.
21
Protocolo HTTP
HTTP define 8 métodos (algunas veces referido como "verbos") que indica la acción
que desea que se efectúe sobre el recurso identificado. Lo que este recurso
representa, si los datos pre-existentes o datos que se generan de forma dinámica,
depende de la aplicación del servidor. A menudo, el recurso corresponde a un archivo
o la salida de un ejecutable que residen en el servidor.
HEAD
Pide una respuesta idéntica a la que correspondería a una petición GET, pero sin el
cuerpo de la respuesta. Esto es útil para la recuperación de meta-información escrita
en los encabezados de respuesta, sin tener que transportar todo el contenido.
GET
Pide una representación del recurso especificado. Por seguridad no debería ser usado
por aplicaciones que causen efectos ya que transmite información a través de la URI
agregando parámetros a la URL.
Ejemplo:
GET /images/logo.png HTTP/1.1 obtiene un recurso llamado logo.png
Ejemplo con parámetros:
/index.php?page=main&lang=es
POST
Somete los datos a que sean procesados para el recurso identificado. Los datos se
incluirán en el cuerpo de la petición. Esto puede resultar en la creación de un nuevo
recurso o de las actualizaciones de los recursos existentes o ambas cosas.
PUT
Sube, carga o realiza un upload de un recurso especificado (archivo), es el camino más
eficiente para subir archivos a un servidor, esto es porque en POST utiliza un mensaje
multiparte y el mensaje es decodificado por el servidor. En contraste, el método PUT
te permite escribir un archivo en una conexión socket establecida con el servidor.
La desventaja del método PUT es que los servidores de hosting compartido no lo
tienen habilitado.
Ejemplo:
PUT /path/filename.html HTTP/1.1
22
Protocolo HTTP
DELETE
Borra el recurso especificado.
TRACE
Este método solicita al servidor que envíe de vuelta en un mensaje de respuesta, en la
sección del cuerpo de entidad, toda la data que reciba del mensaje de solicitud. Se
utiliza con fines de comprobación y diagnostico.
OPTIONS
Devuelve los métodos HTTP que el servidor soporta para un URL especifico.Esto puede
ser utilizado para comprobar la funcionalidad de un servidor web mediante petición en
lugar de un recurso especifico.
CONNECT
Este método se reserva para uso con proxys. Permitirá que un proxy pueda
dinámicamente convertirse en un túnel. Por ejemplo para comunicaciones con SSL.
Connection (conexión)
Connection: close
Esta cabecera indica el idioma de los destinatarios del recurso. Si no existe, se entiende
que el recurso está orientado a todos los usuarios, independientemente del idioma. Esta
cabecera permite listar varios idiomas. Por ejemplo, una herramienta on-line de
traducción inglés-francés, podría incluir en sus páginas la cabecera:
Content-Language: es, fr
Content-Language: es
23
Protocolo HTTP
aunque el contenido pueda estar en inglés (y, por tanto, las metaetiquetas HTML indiquen que
se trata de un documento en inglés).
Indica, como su nombre indica, el tipo de contenido del recurso. Así, la cabecera
indica que el recurso es de tipo texto, concretamente código HTML, y codificado según
la especificación ISO-8859-1.
Date (fecha)
Expect (espera)
Meidante esta cabecera, el cliente indica qué tipo de respuesta espera del servidor. Si el
servidor no está preparado para responder como el cliente espera, debe indicarlo
mediante el envío de un código de estatus 417 (Expectation Failed).
Expires (expiración)
From ("desde")
24
Protocolo HTTP
Se usa junto con la cabecera de método para hacerlo condicional. Esto permite
actualizaciones eficientes de la caché. Si el cliente guarda en su caché alguna entidad
(algún elemento distinguible) del recurso solicitado puede verificar gracias a esta
cabecera si esta entidad sigue estando en vigor, es decir, si la copia guardada en la caché
sigue siendo válida.
Igual que la cabecera If-Match, If-Modified-Since se usa con la cabecera que indica el
método para expresar una condición. Si el recurso no ha variado desde la fecha indicada
por el cliente, el servidor no debe enviarlo. Enviará, en cambio, un código de estatus
304, confirmándole al cliente (navegador, por ejemplo, o robot de un buscador) que la
copia que tiene en caché sigue siendo una copia fiel del recurso guardado en el servidor.
Igual que las cabecera If-Match e If-Modified-Since, se usa junto con la cabecera de
método para someterlo a una condición. Funciona de forma inversa a if-Match. El
servidor no debe ejecutar la solicitud (expresada mediante la cabecera de método) si la
entidad expresada por la condición de If-None-Match se cumple.
IP (remote adress)
No es estrictamente una cabecera del protocolo HTTP, sino del protocolo TCP/IP.
Expresa la identificación numérica de una máquina.
Host (servidor)
Mediante esta cabecera el servidor informa de la fecha y hora en que el recurso fue
modificado por última vez.
Location (localización)
Mediante este campo el servidor indica la dirección (la URL) de un recurso cuando no
se encuentra en la dirección en que se ha solicitado. De esta forma, el servidor invita al
navegador (o al software del cliente en general) a que se redirija a la nueva localización.
Referer (remitente)
25
Protocolo HTTP
Request (solicitud))
Indica el fichero (el documento) solicitada y el método y versión del protocolo que se
van a emplear para realizar la conexión.
Un par de ejemplos:
Errores
2xx. Éxito. Esta clase de códigos indican que la petición del cliente fue recibida,
entendida, aceptada y procesada exitosamente.
26
Protocolo HTTP
4xx. Error en el Cliente. Estos códigos son arrojados cuando el cliente parece tener un
error. Estos tipos de errores son los más comunes que se pueden encontrar.
5xx. Errores de Servidor. El servidor falla cuando aparentemente se esta ante una
petición válida. El Servidor responde con este tipo de errores cuando es incapaz de
realizar la petición
Son los códigos que se ven cuando el navegador no puede mostrar la página solicitada.
El código de respuesta está formado por tres dígitos: el primero indica el estado y los
dos siguientes explican la naturaleza exacta del error.
27
Protocolo HTTP
28
Protocolo HTTP
Almacenamiento en cache.
Las cachés web pueden utilizarse de diversas formas. Las cachés de agente de
usuario (User-Agent), como las presentes en los navegadores web, son cachés
privados, que funcionan solo para un único usuario. También existen paquetes
específicos que se instalan como proxy local y actúan como caché además de realizar
otras tareas, como por ejemplo Proxomitron.
Los intermediarios en la comunicación cliente-servidor también pueden
implementar cachés compartidos (también llamadas proxy-cachés directos) que sirvan
páginas a varios usuarios. Los proxy-cachés suelen ser usados por los proveedores de
servicios de Internet (ISP), universidades y empresas para ahorrar ancho de banda. La
intermediación de estos proxy-cachés difieren de la de los privados en que los clientes
no necesitan ser explícitamente configurados para usarlos. Algunos paquetes que
pueden ser usados como proxy-cachés son Squid, Microsoft ISA Server y Blue Coat.
Las cachés pasarela (llamadas también proxy-cachés inversos o aceleradores web)
funcionan a cargo del propio servidor original, de forma que los clientes no distinguen
unos de otros. Puede hacerse funcionar conjuntamente varias cachés pasarela para
implementar una Content Delivery Network (CDN), como es el caso de Akamai.
Paquetes como Varnish Cache pueden usarse para este propósito.
Los intermediarios que funcionan como caché realizan con frecuencia otras tareas,
tales como la autenticación de usuarios y el filtrado de contenidos. Varios cachés
pueden ser coordinados entre sí con las ayuda de protocolos específicos tales
como ICP o HTCP.
Control de los cachés web
El protocolo HTTP define tres mecanismos básicos para controlar las cachés:
Frescura, que permite que una respuesta sea usada sin comprobar de nuevo el
servidor origen, y puede ser controlada tanto por el servidor como el cliente. Por
ejemplo, la cabecera de respuestaExpires facilita una fecha en la que el documento
caduca, y la directiva Cache-Control: max-age informa al caché del número de
segundos durante los que la respuesta será válida.
Validación, que puede usarse para comprobar si una respuesta cacheada sigue
siendo buena tras caducar. Por ejemplo, si la respuesta tiene una cabecera Last-
Modified, un caché puede hacer una petición condicional usando la cabecera If-
Modified-Since para saber si la página cambió.
29
Protocolo HTTP
- Redirecciones
Existen diferentes casos de real necesidad para los cuales se debe de usar la
redirección: por ejemplo en caso de cambio en la Url de nuestro portal, variación del
nombre de un fichero, o cambio de carpeta en la arborescencia de nuestro sitio web.
Su funcionamiento:
Comprensión
Ventajas
Al comprimir información, esta se envía mucho más rápido desde el servidor hasta el
navegador del visitante, produciendo así una mejor experiencia en la visita del sitio y
recortando la cantidad de ancho de banda --y sus costos-- utilizado por el sitio. En
30
Protocolo HTTP
general se puede conseguir una compresión de entre 5:1 y 10:1 (y de hasta 50:1),
logrando así una reducción del tamaño de las páginas de, en promedio, 65% a 85%.
Esto resulta generalmente en una transferencia de entre 3 a 6 veces más rápido,
Google, Amazon, Yahoo, AT&T y una larga lista de gigantes utilizan esta tecnología. Por
ejemplo la pagina principal de Google tiene apenas 1.412 bytes, que sin compresión
hubiera tenido 3.873 bytes, logrando así un ahorro del 63.5%.
Desventajas
Cookies
Las cookies fueron implementadas por primera vez por Netscape Communications
para la creación del típico cesto de comprar en una tienda online. El problema hasta
entonces era que el protocolo HTTP carecía de la posibilidad de mantener información
pos sí mismo. Los métodos usados antes eran:
Identificación por IP: un método muy poco fiable, pues bajo una misma IP
podían estar accediendo distintos usuarios (por ejemplo desde un cíber),
además que la dirección IP de un usuario puede cambiar.
31
Protocolo HTTP
Autenticación
Autenticación básica: soportado por todos los servidores web y navegadores, así como
terminales móviles.
Autenticación mediante resúmenes ó digest: soportada por todos los servidores y en
algunos navegadores.
Autenticación de Windows integrada: evolución de la antigua autenticación por
desafío respuesta de Windows. Solamente en plataforma Windows para navegador
Internet Explorer.
Autenticación https: es una combinación del protocolo HTTP y protocolos
criptográficos
AUTENTICACIÓN BÁSICA
Cuando el usuario accede a un recurso del servidor web protegido mediante autenticación
básica, tiene lugar el siguiente proceso:
32
Protocolo HTTP
Ventana de autenticación que presenta el navegador cuando se pretende acceder a un recurso protegido.
Dado que el método anterior envía las contraseñas en claro, no resulta muy adecuado
cuando las exigencias de seguridad son elevadas. Para paliar este inconveniente, además de
cifrar el canal con SSL, otra alternativa consiste en enviar un resumen criptográfico de la
contraseña (un hash) en vez de la propia contraseña, de la siguiente forma:
33
Protocolo HTTP
Sólo está soportado por Microsoft Internet Explorer, versión 2.0 o posterior y
servidores NT.
No funciona para conexiones con proxy.
Estas limitaciones hacen que la autenticación integrada de Windows sea más adecuada
para intranets, en las que se puede exigir a los usuarios que el navegador que utilicen sea
Internet Explorer y en las que tanto los servidores como los clientes se encuentran detrás del
mismo proxy. Es muy importante que las cuentas de los usuarios que se autentiquen de esta
forma posean el derecho de Acceder a este equipo desde la red.
AUTENTICACIÓN HTTPS
El uso del formato HTTPS para enviar mensajes garantiza la autenticación de los usuarios
que necesitan acceso a los recursos de Message Queue Server por medio de un servidor Web
estableciendo una conexión de nivel de sockets seguro (SSL) para conseguir una comunicación
segura entre un remitente y un destinatario. El emisor es siempre considerado como cliente
SSL y el destinatario como servidor SSL independientemente de si el equipo está ejecutando
Message Queue Server o software de cliente. Tenga en cuenta que la autenticación para
establecer una sesión de SSL no es la misma que la autenticación de mensajes, que confirma
que un mensaje no se ha manipulado y se puede utilizar para comprobar la identidad del
34
Protocolo HTTP
Conexiones persistentes
Las conexiones persistentes del HTTP, también llamadas HTTP guardar-vivo, o reutilización de
la conexión del HTTP, son la idea de usar la misma conexión del TCP para enviar y para recibir
múltiplo Peticiones del HTTP/responses, en comparación con abrir una nueva conexión para
cada solo par de la petición/de la respuesta.
Ventajas
menos CPU y uso de la memoria (porque pocas conexiones están abiertas
simultáneamente)
permite Can#ería del HTTP de peticiones y de respuestas
los errores se pueden divulgar sin la pena de cerrar la conexión del TCP
Según RFC 2616 (página 47), un cliente single-user no debe mantener más de 2 conexiones
con ningún servidor o poder. A poder debe utilizar hasta las conexiones 2*N a otro servidor
o poder, donde está el número N de usuarios simultáneamente activos. Estas pautas se
piensan para mejorar tiempos de reacción del HTTP y para evitar la congestión.
35
Protocolo HTTP
Después de esto, la conexión no se cae, sino que se mantiene abierta. Cuando el cliente
envía una nueva solicitud, que utiliza la misma conexión. Esto continuará hasta que el cliente
o el servidor decide que la conversación ha terminado, y uno de ellos cae la conexión.
En HTTP 1.1 se consideran todas las conexiones persistentes menos que se declare lo
contrario. Las conexiones HTTP persistentes no utilizan separar los mensajes de keepalive,
que sólo permiten múltiples solicitudes para el uso de una única conexión. Sin embargo, el
tiempo de espera de conexión por defecto de Apache httpd 2.0 es tan poco como 15
segundos y para Apache 2.2 a 5 segundos. La ventaja de un tiempo corto es la capacidad de
ofrecer múltiples componentes de una página web de forma rápida sin atar varios procesos
de servidor o discusiones durante mucho tiempo.
36
Protocolo HTTP
Todas las líneas que comienzan con el símbolo # son comentarios, explican en cada sección las
distintas opciones pero se encuentran en ingles.
La línea 52 Listen indica el puerto y dirección IP por el que el servidor va a recibir las
peticiones, puedes usarla de las siguientes maneras:
1- El servidor va recibir peticiones solo de la misma PC: Listen localhost:80
2- Recibirá peticiones de otras máquinas en una red local: Listen 80
USO
1- Probar y ver las páginas web como verdaderamente van a mostrarse desde internet antes
de subirlas a un host o servidor en la red. Útil e indispensable si tienes o vas a crear tu sitio por
modesto que este sea.
2- Crear mediante el modulo Virtual Host múltiples sitios web en nuestra PC, que podemos
descargar con wget y acceder a ellos igual que en la red pero esta vez de forma local.
3- Poder ver localmente páginas web hechas en lenguaje php.
4- Servir nuestras páginas o sitio web directamente a internet, a los que puede acceder y
conectarse cualquier persona desde el exterior, en este caso lógicamente el funcionamiento
del servidor estará limitado al tiempo que tengamos funcionando la PC y a las posibilidades de
nuestra conexión. Puede constituir una experiencia muy alentadora para cualquier aficionado,
esta posibilidad da la ventaja de que no es necesario depender de ninguna compañía ni
servidor remoto para subir a la red el contenido que queremos mostrar. Es como montar una
pequeña estación de radio y empezar a transmitir, (una similitud) pero en este caso el alcance
es global.
5- Puede actuar como intermediario entre nuestra PC e internet lo que nos da varias ventajas
en el ámbito de la seguridad.
6- A través de él podemos servir internet a varias PC conectadas en una red local.
7- Es posible activar un módulo que permite guardar en cache todas las páginas cargadas lo
que mejorará el rendimiento de nuestra navegación.
37
Protocolo HTTP
Esquema de Descripción
autenticación
Anónimo Una solicitud anónima no contiene ninguna información de autenticación. Esto
equivale a conceder acceso al recurso a todo el mundo.
Básica La autenticación básica envía una cadena codificada por Base64 que contiene un
nombre de usuario y contraseña para el cliente. Base64 no es una forma de
cifrado y debe considerarse igual que enviar el nombre de usuario y contraseña
en texto no cifrado. Si un recurso necesita ser protegido, considere
fervientemente utilizar un esquema de autenticación distinto de la autenticación
básica.
Implícita La autenticación implícita es un esquema de desafío-respuesta destinado a
reemplazar a la autenticación básica. El servidor envía una cadena de datos
aleatorios llamada valor de seguridad (nonce) al cliente a modo de desafío. El
cliente responde con un hash que incluye el nombre de usuario, contraseña y
valor de seguridad, entre otra información adicional. La complejidad que
introduce este intercambio y el hash de datos hacen que sea más difícil robar y
reutilizar las credenciales del usuario con este esquema de autenticación.
38
Protocolo HTTP
Los archivos de registros o archivos log como se conocen comummente, son archivos en donde
se van almacenando un registro de todos los eventos que ocurren en un sistema durante un
periodo de tiempo en particular. Estos archivos son usados tanto por el sistema operativo
como por las aplicaciones o demonios (procesos) para registrar datos o informacion sobre un
evento en particular. En un sistema Linux podemos encontrar estos archivos de registro o logs
en la carpeta /var/log En esta carpeta encontraremos casi todos los archivos de registros de
un sistema, pero cabe destacar que muchas aplicaciones crean estos archivos en sus propias
carpetas fuera de /var/log.
Ahora bien, ¿En que nos sirve los logs para monitorear nuestro sistema? pues muy sencillo, los
principales archivos logs que estan en la carpeta /var/log van almacenando informacion de casi
todos los eventos que ocurren en tu PC practicamente desde que la enciendes y en ellos
podremos ver por ejemplo que pasa internamente en Linux cuando conectas una Memoria
USB, un Modem USB o cuando estas conectado a internet puedes ver los intentos de entrada
bloqueados por tu firewall. En otras circunstancias podremos ser capaces de observar algun
mensaje de error que se pueda producir cuando estas conectando algun hardware nuevo o si
tienes un servicio web instalado podras ver quienes estan conectados a tu equipo.
Tipos MIME
39
Protocolo HTTP
Prácticamente todos los mensajes de correo electrónico escritos por personas en Internet y
una proporción considerable de estos mensajes generados automáticamente son transmitidos
en formato MIME a través de SMTP. Los mensajes de correo electrónico en Internet están tan
cercanamente asociados con el SMTP y MIME que usualmente se les llama mensaje
SMTP/MIME.
En 1991 la IETF (Grupo de Trabajo en Ingeniería de Internet, Internet Engineering Task Force
en inglés) comenzó a desarrollar esta norma y desde 1994 todas las extensiones MIME están
especificadas de forma detallada en diversos documentos oficiales disponibles en Internet.
MIME está especificado en seis Request for Comments o RFC (en español "solicitud de
comentarios): RFC 2045, RFC 2046, RFC 2047, RFC 4288, RFC 4289 y RFC 2077.
Los tipos de contenido definidos por el estándar MIME tienen gran importancia también fuera
del contexto de los mensajes electrónicos. Ejemplo de esto son algunos protocolos de red tales
como HTTP de la Web. HTTP requiere que los datos sean transmitidos en un contexto de
mensajes tipo e-mail aunque los datos pueden no ser un e-mail propiamente dicho.
Subtipos de Multiparte
El estándar MIME define varios subtipos para mensajes multiparte, estos especifican la
naturaleza de la parte del mensaje y su relación con otras partes. El subtipo es especificado en
el encabezado "Content-type" para todo el mensaje. Por ejemplo, un mensaje MIME
multiparte que usa el subtipo digest tendrá un "Content-Type": "multipart/digest".
La RFC inicialmente define 4 subtipos: mixed, digest, alternate y parallel. Una aplicación que
cumpla mínimamente el estándar debe soportar al menos mixed y digest; el resto de los
subtipos son opcionales. Otras RFCs definen subtipos adicionales como: signed y form-data.
Mixed
Message
40
Protocolo HTTP
] Digest
Alternative
El subtipo multipart/alternative indica que cada parte es una versión "alternativa" del mismo
contenido (o similar), cada una en formatos diferentes denotados por su encabezado
"Content-Type". Los formatos son ordenados atendiendo a cuan fieles son al original, con el
menos fiel al inicio. Los sistemas pueden escoger la "mejor" representación que ellos son
capaces de procesar; en general esta será la última parte que el sistema entiende, a menos
que otros factores puedan afectar este comportamiento.
Related
El subtipo multipart/related es usado para indicar que las partes del mensaje no deben ser
consideradas individualmente sino como agregados de un todo. El mensaje consiste de una
parte raíz (implícitamente la primera) que hace referencia a otras partes, las que a su vez
pueden hacer referencia a otras partes. Las partes son comúnmente referenciadas por el
encabezado: "Content-ID". La sintaxis de la referencia no está especificada sino que está
dictada por la codificación o el protocolo usado en la parte que contiene la referencia.
Un uso común de este subtipo es para enviar páginas web completas con imágenes en un
único mensaje. La parte raíz contendría el documento HTML, que usaría etiquetas HTML para
imágenes, para referirse a las imágenes almacenadas en partes subsiguientes.
Report
Multipart/report es un tipo de mensaje que contiene datos formateados para que que un
servidor de correo lo interprete. Está entre un text/plain (o algún otro tipo de contenido
fácilmente legible) y un message/delivery-status.
Signed
El subtipo multipart/signed es usado para adjuntar una firma digital al mensaje. Esta tiene dos
partes, una parte cuerpo y una parte firma. La parte del cuerpo completa, incluyendo los
encabezados MIME, es usada para crear la parte de la firma. Existen muchos tipos de firmas,
como application/pgp-signature y application/x-pkcs7-signature.
41
Protocolo HTTP
Encrypted
Form Data
Mixed-Replace (Experimental)
Todas las partes de un mensaje mixed-replace poseen el mismo significado semántico. Sin
embargo, cada parte invalida - "reemplaza" - a la parte previa tan pronto como es recibida
completamente. Los clientes deben procesar la parte individual al momento de su llegada y no
deben esperar a que termine el mensaje completo.
Desarrollado originalmente por Netscape, aún es soportado por Mozilla, Firefox, Safari (pero
no en Safari para iPhone) y Opera, pero tradicionalmente ignorada por Microsoft.
Webdav
El objetivo de WebDAV es hacer de la World Wide Web un medio legible y editable, en línea con
la visión original de Tim Berners-Lee. Este protocolo proporciona funcionalidades para crear,
cambiar y mover documentos en un servidor remoto (típicamente un servidor web). Esto se
utiliza sobre todo para permitir la edición de los documentos que sirve un servidor web, pero
puede también aplicarse a sistemas de almacenamiento generales basados en web, que pueden
ser accedidos desde cualquier lugar. La mayoría de los sistemas operativos modernos
proporcionan soporte para WebDAV, haciendo que los ficheros de un servidor WebDAV
aparezcan como almacenados en un directorio local.
42
Protocolo HTTP
Recurso es el nombre HTTP para una referencia que está apuntada por un Identificador de
Recursos Uniforme o URI (Uniform Resource Identifier).
El grupo de trabajo WebDAV esta todavía trabajando en unas cuantas extensiones a WebDAV,
incluyendo: control de redirecciones, enlaces, límites de espacio en disco y mejoras en la
especificación base para que alcance el nivel de madurez del resto de estándares de Internet.
Navegadores web
Tales documentos, comúnmente denominados páginas web, poseen hipervínculos que enlazan
una porción de texto o una imagen a otro documento, normalmente relacionado con el texto o
la imagen.
43
Protocolo HTTP
Algunos de los navegadores web más populares se incluyen en lo que se denomina una Suite.
Estas Suite disponen de varios programas integrados para leer noticias de Usenet y correo
electrónico mediante los protocolos NNTP, IMAP y POP.
Los primeros navegadores web sólo soportaban una versión muy simple de HTML. El rápido
desarrollo de los navegadores web propietarios condujo al desarrollo de dialectos no
estándares de HTML y a problemas de interoperabilidad en la web. Los más modernos (como
Google Chrome, Amaya, Mozilla, Netscape, Opera e Internet Explorer 9.0) soportan los
estándares HTML y XHTML (comenzando con HTML 4.01, los cuales deberían visualizarse de la
misma manera en todos ellos).
Los estándares web son un conjunto de recomendaciones dadas por el World Wide Web
consortium W3C) y otras organizaciones internacionales acerca de como crear e interpretar
documentos basados en la web. Su objetivo es crear una web que trabaje mejor para todos,
con sitios accesibles a mas personas y que funcionen en cualquier dispositivo de acceso a
Internet.
Barra de Título
44
Protocolo HTTP
Barra de Menús
Barra de Herramientas
La barra de herramientas tiene botones para los comandos utilizados con más
frecuencia. Cuando el ratón pasa por encima de un botón, este se verá en colores y
parecerá en relieve. Algunos botones no se verán, si el tamaño de la ventana es
pequeño.
45
Protocolo HTTP
Barra de Direcciones
Puede escribir una URL en la Barra de Direcciones y apretar la tecla ENTRAR para
desplegar la página cuya ubicación ha escrito.
Un vínculo hacia otra página web, imagen, o archivo, debería verse como
extraordinaria. Un vínculo de texto por defecto, debería verse subrayado y el texto en
color azul. Usted hace un clic en un link para apuntar a su objetivo en el navegador.
46
Protocolo HTTP
Barra de Estado
La Barra de Estado le contesta a usted. En su lado izquierdo verá mensajes sobre qué
es lo que el navegador está haciendo. El mensaje más común es "Terminado"
, lo cual significa que el navegador cree que ha finalizado la carga
de una página web.
Barra de Vínculos
La Barra de Vínculos, es un lugar conveniente para los atajos hacia las páginas web a
las que accede con mayor frecuencia. IE ya viene con algunos sitios de Microsoft que
se ven en la Barra de Vínculos. Según las diferentes versiones, se verán sitios algo
distintos en la lista. Puede borrar aquellos sitios y agregar los suyos propios.
A la derecha, puede ver los vínculos que no se muestran, desplegando la barra con
un clic en la flecha en el extremo derecho.
Protocolo HTTPS
Hypertext Transfer Protocol Secure (HTTPS), es un
protocolo de red basado en el protocolo HTTP,
destinado a la transferencia segura de datos de
47
Protocolo HTTP
hipertexto, es decir, es la versión segura de HTTP. Es utilizado por cualquier tipo de servicio
que requiera de envió de datos personales o contraseñas.
La idea del protocolo, es crear un canal seguro sobre una red insegura. Proporcionando
seguridad frente ataques eavesdropping y man in the midle, siempre que tenga un método de
cifrado adecuados y un certificado del servidor validos.
Para conocer si una página web utiliza el protocolo HTTPS, debemos observar si la dirección de
nuestro navegador muestra la sigla HTTPS al comienzo en lugar de HTTP y que al final de la
barra de direcciones aparezca un candado para indicarnos que el protocolo de comunicación
es seguro
HTTPS utiliza un cifrado en SSL/TLS para crear un canal de cifrado más apropiado para el
trafico de información sensible. De este modo consigue que esta información no pueda ser
usada por un atacante que haya conseguido interceptar la transferencia de datos de la
conexión, ya que lo único que obtendrá será un flujo de datos cifrados que le resultara
imposible de descifrar. El puerto estándar del protocolo HTTPS es el 443
A nivel de red el protocolo HTTP opera en la capa más alta del Modelo OSI, la capa aplicación;
mientras que el protocolo HTTPS opera en una subcapa más baja, cifrando un mensaje HTTP
previo a la transmisión y descifrando un mensaje una vez recibido.
Estrictamente hablando, HTTPS no es un protocolo separado, pero refiere el uso del HTTP
ordinario sobre una Capa de conexión Segura cifrada: Secure Sockets Layer (SSL) o una
conexión con Seguridad de la Capa de Transporte (TLS).
Limitaciones
48
Protocolo HTTP
-Debido a que SSL opera bajo HTTP y no tiene conocimiento de protocolos de nivel
más alto, los servidores SSL solo pueden presentar estrictamente un certificado para
una combinación de puerto/IP en particular. Esto quiere decir, que en la mayoría de
los casos, no es recomendable usar Hosting virtual name-based con HTTPS.
Existe una solución llamada Server Name indication (SNI) que envía el hostname al servidor
antes de que la conexión sea cifrada, sin embargo muchos navegadores antiguos no soportan
esta extensión. El soporte para SIN esta disponible desde Firefox 2, Opera 8 e Internet Explorer
7 sobre Windows Vista.
49
Protocolo HTTP
Cliente y servidor negocian una clave secreta (simétrica) común llamada master secret,
posiblemente usando el resultado de un intercambio Diffie-Hellman, o simplemente
cifrando una clave secreta con una clave pública que es descifrada con la clave privada
de cada uno. Todos los datos de claves restantes son derivados a partir de este master
secret (y los valores aleatorios generados en el cliente y el servidor), que son pasados a
través una función pseudoaleatoria cuidadosamente elegida.
Hypertext Transfer Protocol Secure (ó HTTPS) es una combinación del protocolo HTTP y
protocolos criptográficos. Se emplea para lograr conexiones más seguras en la WWW,
generalmente para transacciones de pagos o cada vez que se intercambie información sensible
(por ejemplo, claves) en internet.
De esta manera la información sensible, en el caso de ser interceptada por un ajeno, estará
cifrada.
El HTTPS fue creado por Netscape Communications en 1994 para su navegador Netscape
Navigator.
Para distinguir una comunicación o página web segura, la URL debe comenzar con "https://"
(empleando el puerto 443 por defecto); en tanto la tradicional es "http://" (empleando el
puerto 80 por defecto).
Originalmente HTTPS sólo utilizaba encriptación SSL, luego reemplazado por TLS.
50
Protocolo HTTP
HTTPS fue adoptado como estándar web por el grupo IETF tras la publicación del RFC 2818 en
mayo de 2000.
HTTP opera en la capa más alta del modelo TCP/IP, la capa de Aplicación. Pero el protocolo de
seguridad trabaja en una subcapa inferior, codificando el mensaje HTTP antes de ser
transmitido y decodificando el mensaje antes de que llegue.
Adquiriendo Certificados
Adquirir certificados puede ser gratuito (generalmente sólo si se paga por otros
servicios) o costar entre US$13 y US$1,500 por año.
El sistema puede también ser usado para la Autenticación de clientes con el objetivo
de limitar el acceso a un servidor web a usuarios autorizados. para hacer esto, el
administrador del sitio típicamente crea un certificado para cada usuario, un
certificado que es guardado dentro de su navegador. Normalmente, este contiene el
nombre y la dirección de correo del usuario autorizado y es revisado automáticamente
en cada reconexión para verificar la identidad del usuario, potencialmente sin que
cada vez tenga que ingresar una contraseña.
El término Hosting Virtual se refiere a hacer funcionar más de un sitio web (tales como
www.company1.com y www.company2.com) en una sola máquina. Los sitios web virtuales
pueden estar "basados en direcciones IP", lo que significa que cada sitio web tiene una
dirección IP diferente, o "basados en nombres diferentes", lo que significa que con una sola
dirección IP están funcionando sitios web con diferentes nombres (de dominio). El hecho de
que estén funcionando en la misma máquina física pasa completamente desapercibido para el
usuario que visita esos sitios web.
Apache fue uno de los primeros servidores web en soportar hosting virtual basado en
direcciones IP. Las versiones 1.1 y posteriores de Apache soportan hosting virtual (vhost)
51
Protocolo HTTP
basado tanto en direcciones IP como basado en nombres. Ésta última variante de hosting
virtual se llama algunas veces basada en host o hosting virtual no basado en IP.
También llamado IP dedicado o virtual hosting, cada máquina virtual tiene una dirección IP
diferente. El servidor Web está configurado con múltiples interfaces de red física, o interfaces
de red virtual en la misma interfaz física. El software del servidor web, utiliza la dirección IP del
cliente se conecta con el fin de determinar a qué sitio web para mostrar al usuario. La razón
principal de un sitio para que utilice una IP dedicada debe ser capaz de utilizar su propio
certificado SSL en lugar de un certificado común.
El hosting virtual basado en IPs usa la dirección IP de la conexión para determinar qué host
virtual es el que tiene que servir. Por lo tanto, necesitará tener diferentes direcciones IP para
cada host. Si usa hosting virtual basado en nombres, el servidor atiende al nombre de host que
especifica el cliente en las cabeceras de HTTP. Usando esta técnica, una sola dirección IP puede
ser compartida por muchos sitios web diferentes.
El hosting virtual basado en nombres es normalmente más sencillo, porque solo necesita
configurar su servidor de DNS para que localice la dirección IP correcta y entonces configurar
Apache para que reconozca los diferentes nombres de host. Usando hosting virtual basado en
nombres también se reduce la demanda de direcciones IP, que empieza a ser un bien escaso.
Por lo tanto, debe usar hosting virtual basado en nombres a no ser que haya alguna razón
especial por la cual tenga que elegir usar hosting virtual basado en direcciones IP. Algunas de
estas razones pueden ser:
52
Protocolo HTTP
Basado en puerto
El número de puerto por defecto para HTTP es 80. Sin embargo, la mayoría de servidores web
se puede configurar para funcionar en casi cualquier número de puerto, siempre que el
número de puerto no está en uso por cualquier otro programa en el servidor.
Por ejemplo, un servidor puede alojar el sitio web www.example.com. Sin embargo, si el
propietario desea operar un segundo sitio, y no tiene acceso a la configuración del nombre de
dominio para su nombre de dominio y / o no posee otras direcciones IP que pueden ser
utilizados para servir el sitio de, en su lugar podría utilizar otro número de puerto, por
ejemplo, www.example.com:81 para el puerto 81, www.example.com:8000 para el puerto
8000, o www.example.com:8080 para el puerto 8080.
Sin embargo, este es un enfoque de usuario poco amigable. Los usuarios no se puede esperar
razonablemente que saber los números de puerto para sus sitios web y móvil de un sitio entre
los servidores puede requerir cambiar el número de puerto. No se usen los números de puerto
estándar también puede ser visto como poco profesional y poco atractivo para los
usuarios. Además, algunos firewalls bloquear todos los puertos, pero la más común,
provocando un sitio alojado en un puerto no estándar que no aparecen disponibles para
algunos usuarios.
Alojamientos híbridos
No son tan baratos como los compartidos, ni tan caros como los dedicados. Sin tantas ventajas
técnicas como éstos últimos, pero sin tantos inconvenientes como los primeros. Una buena
elección intermedia.
Usos
Puente de servidores privados virtuales la brecha entre los servicios de alojamiento web
compartido y hosting dedicado, lo que la independencia de otros clientes del servicio de VPS
en términos de software, pero a menor costo que un servidor dedicado físico. Como VPS
ejecuta su propia copia de su sistema operativo, los clientes tienen superusuario nivel de
acceso a esa instancia del sistema operativo, y se puede instalar casi cualquier software que se
ejecuta en el sistema operativo. Cierto tipo de software no funciona bien en un entorno
virtualizado, como virtualizers sí mismos, algunos proveedores de VPS imponer mayores
restricciones, pero en general son laxas en comparación con los entornos de alojamiento
compartido. Debido a la cantidad de clientes de virtualización generalmente se ejecuta en una
53
Protocolo HTTP
sola máquina, un VPS en general ha limitado el tiempo de procesador, memoria RAM y espacio
en disco.
Para algunos de los paquetes de software de uso común para proporcionar la plataforma de
virtualización , vea la comparación de la plataforma de máquinas virtuales
Nube de servidor
Un VPS que es dinámico (es decir, se puede cambiar en tiempo de ejecución) se refiere a
menudo como un servidor de nube. Atributos clave para esto son:
54