0% encontró este documento útil (0 votos)
106 vistas

Ascii y Unicode

ASCII y Unicode son formatos alfabéticos estándar para codificar caracteres. Mientras que ASCII solo puede codificar caracteres en inglés en 7 u 8 bits, Unicode es capaz de codificar más de 1 millón de caracteres de diferentes idiomas en 16 bits o más. Unicode incluye los primeros 128 caracteres de ASCII y ha reemplazado a ASCII como el estándar más ampliamente utilizado para codificar texto.

Cargado por

luchy s
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
106 vistas

Ascii y Unicode

ASCII y Unicode son formatos alfabéticos estándar para codificar caracteres. Mientras que ASCII solo puede codificar caracteres en inglés en 7 u 8 bits, Unicode es capaz de codificar más de 1 millón de caracteres de diferentes idiomas en 16 bits o más. Unicode incluye los primeros 128 caracteres de ASCII y ha reemplazado a ASCII como el estándar más ampliamente utilizado para codificar texto.

Cargado por

luchy s
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 26

ASCII Y

UNICODE

Ing. Vargas Rocío


Arquitectura de computadores
ISFT N°172
Ejemplo de estructura de datos:

Mundo real Dispositivo de Computadora


Datos entrada Datos

Querida
Teclado 10110010…
mamá:

Camara
10110010…
digital
Formatos alfabéticos estandar

 ASCII
 Unicode
Caracteres y códigos
 ASCII = American National Standard Code for Information
Interchange
 El código alfanumérico más generalizado en la actualidad es el

denominado ASCII
 Este es un código de 7 bit.

 Algunos caracteres largos en ASCII incorporan 8 bits, adicionando

128 caracteres utilizados para representar caracteres, símbolos


gráficos y matemáticos (que no están en Inglés).
 La siguiente tabla muestra una parte del código ASCII:

Ejemplo: la palabra "Start" se representa:


1010011 1110100 1100001 1110010 1110100
Cuadro ASCII
Cuadro ASCII

Bit más significativo

Bit menos significativo


e.g., ‘a’ = 1100001
95 Códigos gráficos
33 Códigos de control
Códigos Alfabéticos
Puntuación, etc.
Ejemplo: “Hello, world”

Binary Hexadecimal Decimal


H = 01001000 = 48 = 72
e = 01100101 = 65 = 101
l = 01101100 = 6C = 108
l = 01101100 = 6C = 108
o = 01101111 = 6F = 111
, = 00101100 = 2C = 44
= 00100000 = 20 = 32
w = 01110111 = 77 = 119
o = 01100111 = 67 = 103
r = 01110010 = 72 = 114
l = 01101100 = 6C = 108
d = 01100100 = 64 = 100
Control o efectores de formato

 BS Back Space (retroceso de espacio)


 HT horizontal Tab(Tabulación Horizontal)
 LF Line Feed (avance de línea)
 VT Vertical Tab (tabulación vertical)
 FF Form Feed (avance de página)
 CR Carriage Return (regreso del carro)
Control de transmisión
 SOH Start Of Heading (comienzo de encabezado)
 STX Start of Text (comienzo del texto)
 ETX End of Text (final de texto)
 EOT End Of Transmission ( final de Transmisión)
 ENQ ENQuiry (interrogación)
 ACK Acknowledge (reconocimiento)
 NAK Negative Acknowledge (reconocimiento negativo)
 SYN Synchronous/idle( síncrono/parado)
 ETB End of Transmission Block (final de bloque
transmitido)
Control de dispositivos y otros

 DC1, DC2, DC3, DC4 Devices controls (controles de


dispositivos)
 NUL Null (nulo)
 BEL Bell (pitido)
 SO Shift Out (fuera de código)
 SI Shift In (dentro de código)
 DEL Delete (borrar)
 SP Space (espacio)
 DLE Data Link Escape (salir del enlace de datos)
 CAN Cancel (cancelar)
 SUB Substitute (sustituir)
 EM End of Medium (fin del medio)
 ESC Escape (salir)
Formatos alfabéticos estandar

• ASCII
• Unicode
Unicode
 Estándar de código de caracteres de internet.
 Capaz de soportar todos los caracteres, códigos
y símbolos multi-idioma.
 Unicode es capaz de codificar alrededor de
1.110.000 caracteres.
Unicode

Representación Unicode de codificar Indica como los diferentes caracteres


caracteres virtualmente para todo son organizados dentro de la
tipo de lenguaje. representación única que toma el
caracter en Hexadecimal.
ASCII vs. Unicode

Muestra como Unicode puede


manipular el estilo de cada caracter. Comparación entre ASCII y
Unicode.
ASCII vs Unicode
-Ambos son
códigos de
carcteres.
-Los primeros
256 códigos de
Unicode son
iguales a ASCII.

-Tiene 1.114.112 posiciones de códigos.


-Tiene128 o 256 códigos.
-Puede codificar caracteres en 16 bits y
-Puede codificar caracteres en 7 u 8 más.
bits
-Puede codificar caracteres virtualmente
-Puede codificar solo caracteres en para todo tipo de lenguajes.
Inglés o Latinoamericano.
-Es superior a ASCII.
Método de codificación
 Unicode Transformation Format (UTF)
 Es un algoritmo que asigna virtualmente todo el código de Unicode
a una única secuencia de byte.
 La mayoría de los documentos y páginas web son codificadas
usando alguno de los UTF.
 Las conversiones entre UTF son algoritmos rápidos y seguros.
 Soporta datos de entrada y salida en múltiples formatos.

NOMBRE UTF-8 UTF-16 UTF-32

Unidades 8 bits 16 bits 32 bits


Códigos UTF
 UTF-7
 Utiliza 7 bits para cada caracter. Fue diseñado para representar ASCII en
mensajes de email que requieren códigos Unicode.
 No es muy utilizado.
 UTF-8
 Es el más popular.
 Utiliza 1 byte para letras y símbolos estándar en Inglés.
 UTF-8 es compatible con ASCII, ya que los primeros 256 caracteres se
asignan a los mismos valores.
Códigos UTF (Cont…)
 UTF-16
 Sutiliza al menos 2 bytes para representar aprox. 65,536 caracteres.
 Utilizado para sistemas como Java y Qualcomm BREW (Binary Runtime
Environment for Wireless)

 UTF-32
 Una codificación multibyte que representa cada carácter con 4 bytes.
 Lo hace espacio ineficiente
 Utilizados en sistemas Unix para almacenamiento de información.
 Se utiliza cuando no hay problemas de memoria y se desea poder utilizar una
sola unidad de código para cada carácter.
Unicode se utiliza en…

Codificar texto para la creación de contraseñas. Codificar caracteres utilizados en la


configuración de un email.

Codificar caracteres en la visualización de todas las Modificar caracteres utilizados en


páginas web. documentos.
La importancia de UNICODE
 Permite que un único producto de software o un único sitio
web se diseñe para varios países, plataformas e idiomas.
 Los datos Unicode se pueden utilizar sin el riesgo de
corrupción de datos.
 Unicode sirve como un punto común en la conversión:
 Es un superconjunto de todos los otros esquemas de codificación de
caracteres comunes.
 Es posible convertir de un esquema de codificación a Unicode y luego de
Unicode a otro esquema de codificación.
Fin

También podría gustarte