Explora más de 1,5 millones de audiolibros y libros electrónicos gratis durante días

Al terminar tu prueba, sigue disfrutando por $11.99 al mes. Cancela cuando quieras.

Procesamiento de imágenes digitales: Avances en la visión artificial para la automatización inteligente
Procesamiento de imágenes digitales: Avances en la visión artificial para la automatización inteligente
Procesamiento de imágenes digitales: Avances en la visión artificial para la automatización inteligente
Libro electrónico375 páginas4 horasCiencia Robótica [Spanish]

Procesamiento de imágenes digitales: Avances en la visión artificial para la automatización inteligente

Calificación: 0 de 5 estrellas

()

Leer vista previa

Información de este libro electrónico

1: Procesamiento de imágenes digitales: Presenta los principios y técnicas fundamentales para manipular imágenes digitales, sentando las bases para los capítulos siguientes.


2: JPEG: Explora el formato JPEG, detallando sus técnicas de compresión, aplicaciones e importancia en el almacenamiento de imágenes digitales.


3: Gráficos de computadora 2D: Examina la creación y manipulación de gráficos 2D, destacando su relevancia en la robótica y la representación visual.


4: Transformación afín: Analiza las transformaciones geométricas, centrándose en cómo se utilizan las transformaciones afines en la alineación y el mapeo de imágenes.


5: Compresión de imágenes: Proporciona una mirada en profundidad a los métodos de compresión, optimizando el almacenamiento y la transmisión de datos de imágenes para un procesamiento eficiente.


6: Compensación de movimiento: Explica las técnicas de estimación de movimiento que ayudan en el seguimiento y la compensación de objetos en movimiento en secuencias de video.


7: Transformada de coseno discreta: Describe la aplicación de la transformada de coseno discreta en la compresión de imágenes, centrándose en su impacto en la compresión JPEG.


8: Cámara de video: investiga el papel de las cámaras de video en la captura y procesamiento de imágenes, crucial para la robótica y el análisis de movimiento.


9: Detector de bordes Canny: analiza el detector de bordes Canny, una herramienta poderosa para identificar límites dentro de imágenes, vital para el reconocimiento de objetos.


10: Imagen digital: profundiza en la esencia de las imágenes digitales, analizando su representación y procesamiento en sistemas digitales.


11: Segmentación de imágenes: cubre los métodos de segmentación de imágenes en regiones significativas, esenciales para la detección y clasificación de objetos en robótica.


12: Cuantización (procesamiento de imágenes): explora el proceso de cuantización en la compresión de imágenes y su efecto en la calidad de la imagen y el tamaño de los datos.


13: Transformación de características invariantes de escala: investiga una técnica para detectar y describir características de imágenes locales, particularmente útil en el reconocimiento y la comparación de objetos.


14: Estimación de movimiento: describe algoritmos para estimar el movimiento en secuencias de video, crucial para el seguimiento y análisis de entornos dinámicos.


15: Filtro mediano: explica el filtro mediano, un método clave en la reducción de ruido en imágenes, importante para mejorar la calidad de imagen en aplicaciones robóticas.


16: Sensor de imagen: proporciona información sobre los sensores de imagen, su funcionamiento y su papel fundamental en la captura de imágenes digitales para su análisis.


17: Resección de cámara: examina el proceso de calibración de cámaras para mapear el espacio 3D a imágenes 2D, vital para obtener datos visuales precisos en robótica.


18: Coincidencia de histogramas: analiza la técnica de coincidencia de histogramas para estandarizar las características de la imagen, mejorando la consistencia en el procesamiento de imágenes.


19: Segmentación de movimiento rígido: analiza métodos para segmentar el movimiento rígido en secuencias de video, esencial para comprender el movimiento de objetos.


20: Compresión de datos: cubre varias técnicas para comprimir datos en formatos de imagen y video, lo que garantiza un almacenamiento y transmisión eficientes.


21: Compresión con pérdida: analiza el concepto de compresión con pérdida, sus desventajas y sus aplicaciones en el almacenamiento y transferencia de imágenes digitales.

IdiomaEspañol
EditorialMil Millones De Conocimientos [Spanish]
Fecha de lanzamiento18 dic 2024
Procesamiento de imágenes digitales: Avances en la visión artificial para la automatización inteligente

Relacionado con Procesamiento de imágenes digitales

Títulos en esta serie (100)

Ver más

Libros electrónicos relacionados

Robótica para usted

Ver más

Categorías relacionadas

Comentarios para Procesamiento de imágenes digitales

Calificación: 0 de 5 estrellas
0 calificaciones

0 clasificaciones0 comentarios

¿Qué te pareció?

Toca para calificar

Los comentarios deben tener al menos 10 palabras

    Vista previa del libro

    Procesamiento de imágenes digitales - Fouad Sabry

    Capítulo 1 : Procesamiento digital de imágenes

    En pocas palabras, el procesamiento digital de imágenes es la manipulación algorítmica de imágenes digitales en una computadora digital. El procesamiento digital de imágenes, un subcampo del procesamiento digital de señales, ofrece muchas ventajas con respecto a su predecesor analógico. Permite el uso de más algoritmos en los datos de entrada y ayuda a evitar que se acumulen problemas como el ruido y la distorsión. El procesamiento digital de imágenes puede describirse como sistemas multidimensionales debido al hecho de que las imágenes se especifican en dos (o más) dimensiones. El avance de la tecnología informática, el crecimiento de las matemáticas (en particular el desarrollo y la mejora de la teoría de las matemáticas discretas) y la creciente demanda de procesamiento digital de imágenes en una variedad de campos, incluidos el medio ambiente, la agricultura, el ejército, la industria y la medicina, son las principales influencias en su creación y crecimiento.

    El procesamiento digital de imágenes, o procesamiento digital de imágenes, como se conocía anteriormente, fue pionero en la década de 1960 por una serie de instituciones de investigación, incluidos los Laboratorios Bell, el Laboratorio de Propulsión a Chorro, el MIT, la Universidad de Maryland y otros para su uso en campos como imágenes satelitales, conversión de estándares de fotografía por cable, imágenes médicas, videoteléfonos, reconocimiento de caracteres y mejora de fotografías.

    Sin embargo, dada la tecnología disponible en ese momento, el costo de procesamiento era bastante alto. Sin embargo, en la década de 1970, el procesamiento digital de imágenes explotó a medida que las computadoras de bajo costo y los equipos especializados se volvieron ampliamente accesibles. Como resultado, desafíos como la conversión de estándares de televisión podrían abordarse en tiempo real utilizando el procesamiento de imágenes. Las computadoras de propósito general comenzaron a reemplazar el hardware especializado para todas las tareas, excepto las más costosas desde el punto de vista computacional, a medida que aumentaban sus velocidades de procesamiento. Con la llegada de potentes ordenadores y procesadores de señales en la década de 2000, el procesamiento digital de imágenes sustituyó rápidamente a las técnicas analógicas como el estándar de oro en la industria.

    La tecnología de semiconductores de óxido metálico (MOS) es la base de los sensores de imagen actuales, La transformada discreta de coseno (DCT) fue una innovación clave en la tecnología de compresión de imágenes digitales que fue presentada inicialmente por Nasir Ahmed en 1972.

    En la década de 1970, el uso generalizado de la tecnología MOS alteró radicalmente el campo del procesamiento electrónico de señales.

    El dispositivo de tomografía computarizada de rayos X (a menudo conocido como TC) para el diagnóstico de la cabeza fue creado en 1972 por el ingeniero (tomografía computarizada) de la empresa británica EMI Housfield. La técnica del núcleo de la TC se basa en una proyección de una sección transversal de una cabeza humana, que luego se procesa digitalmente para recrear la imagen de la sección transversal. Las imágenes tomográficas de diferentes secciones del cuerpo humano se produjeron claramente cuando EMI creó un dispositivo de tomografía computarizada de cuerpo entero en 1975. Este método de diagnóstico fue galardonado con el Premio Nobel en 1979.

    Como resultado del empleo de algoritmos más complicados, el procesamiento digital de imágenes puede proporcionar tanto un mejor rendimiento en trabajos básicos como la introducción de técnicas que serían difíciles de hacer con equipos analógicos.

    El procesamiento digital de imágenes, en particular, es una aplicación útil y una tecnología que se basa en:

    Clasificación

    Extracción de características

    Análisis de señales a varias escalas

    Reconocimiento de patrones

    Proyección

    Ejemplos de métodos utilizados por el procesamiento digital de imágenes:

    Difusión anisotrópica

    Modelos ocultos de Markov

    Edición de imágenes

    Restauración de imagen

    Análisis independiente de componentes

    Filtrado lineal

    Redes neuronales

    Ecuaciones diferenciales parciales

    Pixelación

    Coincidencia de entidades de puntos

    Análisis de componentes principales

    Mapas que se organizan solos

    Wavelets

    Para suavizar o enfocar las fotos digitales, basta con aplicar un filtro adecuado. Es posible filtrar los datos por:

    convolución en el dominio espacial utilizando un conjunto de kernels (filtros) bien elaborados.

    enmascaramiento de dominio de frecuencia (Fourier) para ocultar ciertas frecuencias

    Los dos enfoques se ven a continuación:

    Antes de ser traducidas al espacio de Fourier, las imágenes suelen estar rellenadas; Las imágenes filtradas de paso alto a continuación muestran los efectos de varios métodos de relleno:

    En comparación con el relleno de bordes repetido, el relleno de cero hace que el filtro de paso alto muestre un conjunto adicional de bordes.

    Filtrado de paso alto en el dominio espacial: una demostración de MATLAB.

    img=tablero de ajedrez(20); % generar tablero de ajedrez

    % ************************** DOMINIO ESPACIAL ***************************

    klaplace=[0 -1 0; -1 5 -1; 0 -1 0]; % Kernel de filtro laplaciano

    X=conv2(img,klaplace); % de convolución de la prueba img con

    % 3x3 Semilla laplaciana

    figura()

    imshow(X,[]) % mostrar laplaciano filtrado

    title('Detección de bordes laplacianos')

    A continuación se muestran ejemplos de cómo se pueden utilizar las transformaciones afines para realizar manipulaciones fundamentales de la imagen, como el escalado, la rotación, la traslación, la reflexión y el corte:

    La matriz afín se aplica a una imagen transformándola primero en una matriz donde cada entrada representa la intensidad de un solo píxel. Una vez que se conocen la fila y la columna de un píxel en la matriz de la imagen, la posición de un píxel se puede representar como un vector que muestra las coordenadas de ese píxel en la imagen, [x, y]. Esto permite multiplicar la coordenada por una matriz de transformación afín, que a su vez produce el valor de píxel de la imagen de salida en la ubicación

    ¿Disfrutas la vista previa?
    Página 1 de 1