0% encontró este documento útil (0 votos)

13 vistas7 páginas

Manuscrito 82861 1 10 20240607

Cargado por

nickmillernm22

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

13 vistas7 páginas

Manuscrito 82861 1 10 20240607

Cargado por

nickmillernm22

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

Está en la página 1/ 7

ISSN: 2007-4948

https://repository.uaeh.edu.mx/revistas/index.php/xikua/issue/archive
XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan
13º Congreso Internacional de Computación
Inteligencia artificial: Presente y futuro
Red Iberoamericana de Computación
Vol. 12, Número Especial (2024) 33-39

Reconocimiento de señas de la Lengua de Señas Mexicana mediante técnicas de

Machine Learning
Recognition of signs from Mexican Sign Language using Machine Learning
techniques
Gabriel A. Salgado-Martínez a, René E. Cuevas-Valencia b, Angelino Feliciano-Morales c,
Arnulfo Catalán-Villegas d
Abstract:

The use of Artificial Intelligence techniques for the recognition of signs of the Mexican Sign Language through can contribute to
improve communication between people who speak this language and those who do not know its meaning. In this article, the
performance of Machine Learning models in the recognition of signs was evaluated, for this purpose, four different techniques were
used to train and later test the recognition in new signs. Firstly, a data set of images of the dactylological alphabet of the Mexican
Sign Language was collected, then this data set was used to train sign image recognition models using four different techniques and
later the performance of each model was analyzed in new sign pictures.
Keywords:
Mexican Sign Language, Machine Learning, Translation, Artificial Neural Networks.

Resumen:

El empleo de técnicas de Inteligencia Artificial para el reconocimiento de señas de la Lengua de Señas Mexicana puede contribuir a
mejorar la comunicación entre personas hablantes en esta lengua y quienes desconocen su significado. En este artículo se evaluó el
rendimiento de modelos de Machine Learning en el reconocimiento de señas, para ello se utilizaron cuatro técnicas diferentes para
entrenar y posteriormente probar el reconocimiento en nuevas señas. Primeramente, se recolectó un set de datos de imágenes del
alfabeto dactilológico de la Lengua de Señas Mexicana, luego este set de datos se utilizó para entrenar modelos de reconocimiento de
imágenes de señas utilizando cuatro técnicas diferentes y posteriormente se analizó el rendimiento de cada modelo en nuevas imágenes
de señas.
Palabras Clave:
Lengua de Señas Mexicana, Machine Learning, Reconocimiento, Redes Neuronales Artificiales.

personas aproximadamente 250,000 utilizan la Lengua de

Introducción Señas Mexicana (LSM) para comunicarse [2].
En México la población de personas sordas es de En la sociedad mexicana moderna, las personas que
aproximadamente 1,350,000 [1], de este grupo de utilizan la LSM se encuentran con diversos desafíos que
afectan su calidad de vida y bienestar en general. Uno de
________________________________________________________________________________________________________________________________________________________________________

a Autor de Correspondencia, https://orcid.org/0009-0004-8614-5469, Universidad Autónoma de Guerrero, https://www.uagro.mx/, Email:

[email protected]
b Universidad Autónoma de Guerrero, https://orcid.org/0000-0001-9528-7603, https://www.uagro.mx/, Email: [email protected]
c Universidad Autónoma de Guerrero, https://orcid.org/0000-0002-7707-7319, https://www.uagro.mx/, Email: [email protected]
d Universidad Autónoma de Guerrero, https://orcid.org/0009-0001-0391-7960, https://www.uagro.mx/, Email: [email protected]

Fecha de recepción: 09/04/2024, Fecha de aceptación: 10/05/2024, Fecha de publicación: 01/07/2024

DOI: https://doi.org/10.29057/xikua.v12iEspecial.12696
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

estos obstáculos es el rezago educativo, debido en parte

a que los programas educativos no están diseñados para Primeramente, se analizó la gramática de la LSM, para
satisfacer las necesidades de los estudiantes con diferenciar el tipo de señas fijas y las que requieren
discapacidad auditiva, esto ha llevado a que niñas, niños movimiento en su realización. También se analizaron
y adolescentes sordos se vean privados recibir educación diferentes técnicas para la creación de modelos de ML de
escolar [3]. reconocimiento de imágenes y videos que pueden
Gracias al avance de las diferentes técnicas de implementarse en el proceso de reconocimiento de
Inteligencia Artificial (IA), particularmente el Aprendizaje expresiones de la LSM. Para el entrenamiento de los
Automático o Machine Learning (ML), se han desarrollado modelos de ML se obtuvieron videos de personas
sistemas informáticos capaces de traducir lenguas de realizando diferentes señas para la elaboración del
señas. Este tipo de sistemas utilizan modelos de ML dataset. Posteriormente se realizó el entrenamiento de los
previamente entrenados con datos de muestra para modelos de ML y finalmente se realizaron pruebas en
reconocer patrones, permitiéndoles identificar estos nuevas imágenes de señas. El rendimiento obtenido en
patrones en nuevos datos [4]. Los sistemas traductores de cada técnica se muestra en el apartado de resultados. El
señas utilizan modelos de ML, que se entrenan con esquema de procedimiento general se muestra en la
imágenes y videos de personas realizando diferentes tipos Figura 1.
de señas [5][6][7].
En este trabajo, se aborda el reconocimiento de imágenes
de las señas correspondientes al alfabeto dactilológico de
la LSM, que no requieren movimiento para su realización,
mediante la implementación de modelos de ML de Figura 1. Esquema general propuesto
reconocimiento y clasificación de imágenes. Se
recolectaron secuencias de video de personas realizando
señas, posteriormente se extrajeron los fotogramas de los
Lengua de Señas Mexicana
videos y en cada uno de ellos se extrajo la región de la
mano con la configuración de cada seña, luego con estas Es la lengua de la comunidad sorda en México, se
nuevas imágenes obtenidas se recolectó un set de datos considera como la lengua oficial de señas de México
o dataset compuesto de 126,000 imágenes, que se utilizó desde 2005, de acuerdo con el Consejo Nacional para el
para entrenar modelos de ML empleando cuatro técnicas Desarrollo y la Inclusión de las Personas con
diferentes, los cuales se evaluaron para determinar el Discapacidad, esta lengua es muy rica y compleja tanto
modelo con mejor rendimiento en el reconocimiento de en gramática como en vocabulario como cualquier lengua
nuevas imágenes de señas. oral [8]. En la LSM el intercambio de mensajes es a través
del uso de señas manuales y gestos faciales que el
destinatario recibe a través de la visión.
Objetivos En la LSM se pueden diferenciar dos tipos principales de
señas, primeramente las señas que se realizan con una
expresión manual fija, estas señas componen
Objetivo general principalmente el alfabeto dactilológico a excepción de las
Evaluar el rendimiento de cuatro diferentes técnicas de letras J, K, Ñ, Q, X y Z y las letras dobles como LL y RR,
Machine Learning para el reconocimiento de señas (Figura 2); el segundo tipo principal de señas
correspondientes al alfabeto dactilológico de la Lengua de diferenciadas son las que implementan movimientos
Señas Mexicana. manuales así como expresiones faciales para su
realización, con este tipo de señas se expresan la gran
Objetivos específicos mayoría de palabras de la LSM [9].
• Recolectar un dataset de imágenes de señas del
alfabeto dactilológico de la Lengua de Señas
Mexicana.
• Desarrollar modelos de Machine Learning para el
reconocimiento de señas implementando cuatro
técnicas diferentes.
• Evaluar el porcentaje de reconocimiento de cada
modelo en un conjunto de nuevas imágenes de señas.

Figura 2. Alfabeto dactilológico de la LSM.

Metodología y procesos de desarrollo

34
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

Obtención y procesamiento de los datos modelo en datos nuevos. Cuando se tiene el modelo
entrenado se prueba con nuevos datos para hacer el
La obtención de datos se obtuvo mediante el trabajo con reconocimiento de las señas. En la Figura 4 se muestra el
8 alumnos del Instituto Tecnológico de Chilpancingo, proceso de entrenamiento de modelos de ML para el
Guerrero. Primeramente, se grabaron videos de las 21 reconocimiento de señas.
señas fijas del alfabeto dactilológico de la LSM, siendo las
señas correspondientes a las letras A, B, C, D, E, F, G, H,
I, L, M, N, O, P, R, S, T, U, V, W e Y. Los videos tuvieron
una duración de 1 minuto cada uno, por cada alumno se
grabó un video para cada una de las 21 señas, en
ubicaciones distintas para procurar que las imágenes
resultantes fueran variadas, en total se obtuvieron 8
videos por cada seña, dando un total de 168 videos.
Posteriormente se extrajeron los fotogramas de cada
video, y luego, con la ayuda de la librería MediaPipe, se
extrajo la región de la mano realizando la seña y Figura 4. Entrenamiento de un modelo de ML para el
posteriormente se guardó como imagen de tamaño 200 x reconocimiento de señas.
200 pixeles. Con este proceso se obtuvieron
aproximadamente 126,000 imágenes, correspondientes a Con el dataset de 65,520 imágenes se entrenaron los
6,000 imágenes en promedio por cada seña. En la Figura modelos de ML implementando las siguientes técnicas: La
3 se muestran ejemplos de las imágenes obtenidas. primera técnica consistió en el entrenamiento de una Red
Neuronal Convolucional (RNC) proporcionándole las
imágenes de forma directa a la red, la segunda fue
utilizando la técnica de Transfer Learning, que consistió en
reentrenar una red neuronal previamente entrenada, la
tercera técnica consistió en crear un modelo de ML
utilizando la plataforma Teachable Machine (TM) [12] y la
cuarta técnica consistió en entrenar nuevamente una RNC
pero esta vez utilizando características específicas
extraídas de las imágenes. Finalmente, en cada uno de
Figura 3. Ejemplos de las imágenes obtenidas. los modelos se realizaron pruebas de inferencias o
Una vez obtenidas las imágenes, se eligieron las más reconocimiento en 100 imágenes nuevas por cada seña.
representativas, cuidando aspectos como que las El procedimiento de cada técnica se explica a
imágenes no fueran tan similares, como los videos continuación:
contenían en promedio 29 fotogramas por segundo, se
eligieron imágenes que tuvieran suficiente variación en la 1. Red Neuronal Convolucional
posición de la mano, también se descartaron las imágenes En este experimento se entrenó una RNC en el lenguaje
donde la forma de la seña no fuera clara, o que tuviera
de programación Python, utilizando las librerías
desenfoque por movimiento de la mano. Después de este
proceso se obtuvo un dataset final de 65,520 imágenes, Tensorflow y Keras. Para el proceso de entrenamiento se
correspondientes a 3,120 para cada seña. dividieron los datos en 70% para el entrenamiento
correspondiente a 2,400 imágenes y 30% para validación,
Entrenamiento de modelos de ML correspondientes a 720 imágenes. Posteriormente se
guardó el modelo de ML obtenido en formato “.h5” con el
El ML se utiliza para crear patrones de reconocimiento en cual se realizaron pruebas de inferencia en nuevos datos.
datos de texto, audio, imagen o video y así reconocer
elementos de nuevos datos y agruparlos en los patrones 2. Transfer Learning
creados [10]. En esta técnica se reentrenó el algoritmo YOLO V5 [13], el
De acuerdo con Torres et al. [11], para el entrenamiento de cual es un algoritmo para el reconocimiento y seguimiento
modelos de reconocimiento de vocabulario de señas, es de objetos en tiempo real. Para este experimento se
importante utilizar un conjunto de datos de señas para el realizaron varias pruebas modificando el tamaño del set
entrenamiento y otro usado como conjunto de validación. de datos, debido a que al realizar el entrenamiento en la
El conjunto de entrenamiento se utiliza para que los plataforma de Google Colab, se presentaron problemas
modelos reconozcan patrones y posteriormente ajustar los para completar el proceso. Finalmente, el entrenamiento
parámetros del modelo, mientras que el conjunto de pudo realizarse utilizando 1,000 imágenes para el
validación se utiliza para evaluar el rendimiento del entrenamiento y 300 para validación.

35
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

Pooling de tamaño (2, 2) respectivamente, luego una capa

3. Plataforma Teachable Machine Flatten del tipo densa de 256 neuronas, con función de
Esta plataforma desarrollada por Google permite la activación “relu” y un dropout de 0.5, y finalmente una
capa densa de 21 neuronas y función de activación
creación de modelos de ML de forma rápida y fácil sin la
“softmax”.
necesidad de conocimientos en programación. En esta La red se compiló con los siguientes parámetros:
plataforma se realizaron varias pruebas con diferentes optimizer: “Adam”, loss: “categorical_crossentropy”, y
cantidades de imágenes para la creación del modelo, ya metrics: “accuracy”. La red se entrenó a 20 épocas,
que al tratar de crear el modelo con 2,400 imágenes por obteniendo los siguientes resultados en la última época:
seña la página dejaba de responder, el número máximo loss: 0.0187, accuracy: 0.9956, val_loss: 0.0351 y
de imágenes con el que pudo crearse el modelo fue de val_accuracy: 0.9949. La gráfica de precisión del modelo
1,000 para cada una de las 21 señas. se muestra en la Figura 6.

4. Red Neuronal Convolucional con características

específicas
Primeramente, se extrajeron características de las
imágenes, que consistieron en las coordenadas (X, Y) de
cada uno de los 21 puntos del Landmark detectado en las
manos por la librería MediaPipe [14], tal como se muestra
en la Figura 5. Posteriormente, estas coordenadas se
exportaron a un archivo CSV.

Figura 6. Gráfica de precisión de la RNC.

En las Figura 6 se aprecia que la precisión en los datos de

validación comienza a asemejarse al entrenamiento
después del 95% a partir de las primeras épocas.
Figura 5. Puntos del Landmark de detectados por
Posteriormente se exportó el modelo al formato “.h5”, con
MediaPipe [14].
este modelo se realizaron las pruebas de inferencia en el
El archivo CSV resultante contenía 42 columnas conjunto de 100 nuevas imágenes por cada seña, los
correspondientes a las coordenadas en X y en Y de los resultados obtenidos se muestran en la Tabla 1.
puntos detectados y 1 columna más para la etiqueta de
cada letra, en un rango del 0 al 20; así como 19,956 filas Tabla 1. Resultados de la inferencia del modelo de la
correspondientes a los datos de las imágenes en las que técnica 1.
Seña Inferencias Inferencias Seña Inferencias Inferencias
se pudieron obtener las coordenadas del Landmark. correctas incorrectas correctas incorrectas
Este archivo CSV se utilizó para entrenar una red neuronal A 40 60 N 35 65
B 0 100 O 54 46
convolucional en el lenguaje de programación Python, C 76 24 P 97 3
D 0 100 R 85 15
utilizando la librería Keras. Posteriormente se realizaron E 60 40 S 61 39
pruebas de entrenamiento, dividiendo los datos en 70% y F 84 16 T 100 0
G 85 15 U 100 0
20%, y 80% y 20% para entrenamiento y validación H 74 26 V 100 0
I 100 0 W 98 2
respectivamente, finalmente se optó por la segunda L 100 0 Y 90 10
M 18 82
configuración de división de los datos, ya que esta alcanzó
mayores valores de precisión en el entrenamiento y la
En la Tabla 2 se aprecia que las señas correspondientes
validación del modelo.
a las letras M, N, S, y W tuvieron un número muy bajo de
Una vez entrenada la red neuronal se exportó el modelo reconocimientos correctos, esto puede ser debido a que
de ML a un archivo de extensión “h5” con el cual se las señas M y N, S y T, y V y W son muy parecidas en su
realizaron nuevamente pruebas de inferencias con nuevos configuración manual.
datos de imágenes.
2. Transfer Learning
El entrenamiento del algoritmo YOLO V5 se realizó en la
Resultados plataforma Colab, utilizando el notebook oficial de
Ultralytics [15] con los parámetros establecidos por
1. Red Neuronal Convolucional defecto para el entrenamiento, tales como el tamaño de
En este caso se entrenó una RNC con tres capas de imagen de 640 x 640 pixeles, tamaño de batch de 16,
convolución, de 32 filtros de tamaño (3, 3), 64 filtros de número de épocas 20 y el archivo de pesos utilizado fue
tamaño (3, 3), 128 filtros de tamaño (3, 3) con función de “yolov5s.pt”.
activación “relu”, respectivamente, y tres capas de Max

36
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

Los resultados obtenidos al realizar pruebas con las de salida tiene 21 neuronas, esto para clasificar las 21
nuevas imágenes se muestran en la Tabla 2. señas fijas del abecedario dactilológico de la LSM, esta
última capa tiene una función de activación “softmax”. La
Tabla 2. Resultados de la inferencia del modelo de la
red se compiló con los siguientes parámetros: optimizer:
técnica 2.
Seña Inferencias Inferencias Seña Inferencias Inferencias “Adam”, loss: “categorical_crossentropy”, y metrics:
A
correctas
98
incorrectas
2 N
correctas
100
incorrectas
0
“accuracy”.
B 99 1 O 90 10 Para el entrenamiento se realizaron varios experimentos
C 97 3 P 99 1
D 100 0 R 100 0 modificando el número de épocas entre 50, 100, 150, 200
E 100 0 S 100 0
F 100 0 T 100 0
y 300, al final se optó por monitorear la métrica
G 18 82 U 98 2 “val_accuracy” con una paciencia de 10, para detener el
H 100 0 V 100 0
I 100 0 W 100 0 entrenamiento si mejoraba después de transcurridas 10
L 100 0 Y 100 0
épocas, con este ajuste el entrenamiento se detuvo en
120 épocas, en la que se obtuvieron los siguientes
En la Tabla 2 se puede apreciar que las señas que valores; loss: 0.1167, acuraccy: 0.9635, val_loss: 0.0593
tuvieron mayores problemas al reconocerse fueron la G y y val_accuracy: 0.9855.
M, con un número de inferencias correctas menor a 90. A continuación, se muestran las gráficas de precisión,
pérdida y la matriz de confusión del modelo:
3. Plataforma Teachable Machine
La plataforma de TM permite guardar los modelos creados
en varios formatos, en este caso se descargó el formato
de Tensorflow, específicamente con extensión “.h5” y
posteriormente se realizaron las pruebas de inferencias en
las nuevas imágenes. En la Tabla 3 se muestran los
resultados obtenidos.

Tabla 3. Resultados de la inferencia del modelo de la

técnica 3.
Seña Inferencias Inferencias Seña Inferencias Inferencias
correctas incorrectas correctas incorrectas
A 68 32 N 98 2 Figura 7. Gráfica de precisión del modelo.
B 0 100 O 54 46
C 70 30 P 11 89
D 45 55 R 18 82 En las Figura 7, se muestra la precisión alcanzada del
E 76 24 S 0 100
F 18 82 T 11 89 modelo durante las épocas de entrenamiento, a partir de
G 58 42 U 99 1
H 64 36 V 83 17
aproximadamente la época 40 la precisión de los datos de
I 91 9 W 66 34 entrenamiento y validación comenzó a converger, siendo
L 90 10 Y 4 96
M 1 99 una precisión final en el entrenamiento del 96% y en los
datos de validación del 98%.
Como se puede apreciar en la Tabla 3 los resultados
obtenidos fueron malos en términos generales, con casos
donde el reconocimiento correcto fue de 0 como en las
señas B y S, además solo las señas I, L, N, y U tuvieron
reconocimientos arriba de 90.

4. Red Neuronal Convolucional con características

específicas
En este caso se entrenó una red neuronal del tipo
perceptrón multicapa o Feedforward, el modelo tiene una
primera capa de entrada de 256 neuronas con función de
activación “relu”, luego se asignó una capa de dropout con Figura 8. Gráfica de pérdida del modelo.
una tasa de 0.5, que indica que se utilizarán solamente el
50% de las neuronas de forma aleatoria para evitar el En la Figura 8, se muestra la taza de pérdida de los datos
sobreajuste durante el entrenamiento. Después, se de entrenamiento y prueba, a partir de la época 40 los
configuró una capa oculta de 128 neuronas con función de datos comienzan a converger a 0 y se alcanza una pérdida
activación “relu”, con una capa de dropout de 0.3. en el entrenamiento de 0.1315… y en la validación de
Posteriormente, se configuraron dos capas ocultas más, 0.0669…
una de 64 neuronas y la otra de 32 neuronas, con
funciones de activación “relu”, cada una con capas de
dropout de 0.2 y 0.1 respectivamente. Finalmente, la capa

37
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

condujo a una buena precisión de la clasificación de

nuevas imágenes de señas.
Esto indica que al realizar el entrenamiento con extracción
de características específicas de las imágenes de señas
el rendimiento es mejor que al entrenar el modelo con los
datos de las imágenes completas, como fue en el caso de
la primera técnica, donde a pesar de que se obtuvo un
valor de accuracy del 99% a lo hora de realizar inferencias
en nuevas imágenes el rendimiento no fue el esperado.
En el caso de los modelos desarrollados con las técnicas
Figura 9. Matriz de confusión del modelo. de la Plataforma Teachable Machine y Transfer Learning,
los resultados sugieren que es necesario continuar
En la Figura 9, la matriz de confusión muestra en los ejes realizando pruebas de entrenamiento con mayor número
X y Y las etiquetas correspondientes a las 21 letras del de imágenes, para mejorar el rendimiento en el
entrenamiento, en la diagonal principal se muestran los reconocimiento de nuevas señas.
valores reconocidos correctamente y en las demás celdas Aunque en este estudio únicamente se analizaron señas
se muestran los falsos positivos. Como se puede apreciar fijas, los resultados sugieren que en futuros trabajos se
la mayoría de los datos fueron reconocidos podría explorar el desarrollo de modelos para el
correctamente. reconocimiento de señas con movimiento, al implementar
Posteriormente se realizaron las pruebas de inferencias MediaPipe para extraer características de puntos
en las nuevas imágenes, los resultados obtenidos se específicos de las manos y otras partes del cuerpo, a partir
muestran en la Tabla 4. de secuencias de video, que servirían para entrenar
modelos de reconocimiento de secuencias de datos.
Tabla 4. Resultados de la inferencia del modelo de la Para poder desarrollar los modelos fue necesario
técnica 4.
Seña Inferencias Inferencias Seña Inferencias Inferencias recolectar los datos de imágenes a través de la grabación
correctas incorrectas correctas incorrectas de videos de las señas realizadas por un equipo 8
A 100 0 N 100 0
B 100 0 N 100 0 personas, ya que en la actualidad no se cuenta con un
C 100 0 O 100 0
D 100 0 P 100 0 base de datos señas de la LSM. El dataset resultante
E 100 0 R 100 0
F 100 0 S 100 0
mostró ser una buena fuente de datos para entrenar
G 100 0 T 100 0 modelos de reconocimiento de señas, por lo que este
H 100 0 U 100 0
I 100 0 V 100 0 dataset obtenido puede servir como base para futuros
L 100 0 W 89 11
M 93 7 Y 100 0 trabajos enfocados al reconocimiento de la LSM mediante
técnicas de ML.
En la tabla 4 se aprecia que únicamente en las señas
correspondientes a las letras M y W se realizaron Agradecimientos
inferencias incorrectas, siendo 7 y 11 respectivamente, y
Agradecemos a la coordinación de la Maestría en
por en las señas restantes el porcentaje de
Ingeniería para la Innovación y Desarrollo Tecnológico por
reconocimiento correcto fue del 100%.
prestar sus ubicaciones para poder llevar a cabo la
realización de este proyecto. Agradecemos de igual forma
Conclusiones a los alumnos del Instituto Tecnológico de Chilpancingo,
que generosamente brindaron su tiempo en la realización
En este estudio se analizaron y compararon cuatro
de las actividades solicitadas, sin su apoyo este trabajo no
técnicas diferentes de desarrollo de modelos de ML para
hubiera podido llevarse a cabo. Agradecemos también al
el reconocimiento de señas de la LSM. El objetivo fue
CONACYT por el apoyo económico brindado durante la
evaluar el rendimiento de estas técnicas en el
realización de este proyecto.
entrenamiento y reconocimiento de nuevas imágenes de
señas del alfabeto dactilológico de la LSM.
De acuerdo al objetivo general y al objetivo específico de Referencias
desarrollar modelos de ML y en concordancia con los
resultados obtenidos podemos concluir qué el modelo que [1] Instituto Nacional de Estadística y Geografía. (2020). Población con
discapacidad o limitación en la actividad cotidiana por entidad
mejor rendimiento demostró fue el obtenido con la técnica federativa y tipo de actividad realiza según sexo, 2020.
de Red Neuronal Convolucional con características https://www.inegi.org.mx/app/tabulados/interactivos/?pxq=Discapacid
específicas, puesto que demostró una alta capacidad para ad_Discapacidad_02_2c111b6a-6152-40ce-bd39-
6fab2c4908e3&idrt=151&opc=t, fecha de consulta: 19 de octubre de
reconocer características de nuevas imágenes, lo que 2022.

38
Publicación semestral, XIKUA Boletín Científico de la Escuela Superior de Tlahuelilpan, Vol. 12, Número Especial (2024) 33-39

[2] Diario Oficial de La Federación. (2011). Ley General para la Inclusión

de las Personas con Discapacidad. Secretaría de Gobernación.
https://dof.gob.mx/nota_detalle.php?codigo=5191516&fecha=30/05/2
011#gsc.tab=0, fecha de consulta 19 de octubre de 2022.

[3] Cámara de Diputados. (10 de febrero de 2021). Aprueban reformas para

que personas con discapacidad auditiva reciban educación bilingüe en
lengua de señas. Honorable Cámara de Diputados.
https://comunicacionnoticias.diputados.gob.mx/comunicacion/index.ph
p/boletines/aprueban-reformas-para-que-personas-con-discapacidad-
auditiva-reciban-educacion-biling-e-en-lengua-de-se-as#gsc.tab=0,
fecha de consulta: 19 de octubre de 2022.

[4] Alpaydin, E. (2010). Introduction to machine Learning. The MIT Press.

Massachusetts. ISBN 978-0-262-01243

[5] Mejía, K. (2022). Sistema de reconocimiento del Lenguaje de Señas

Mexicano basado en una cámara RGB-D y aprendizaje automático.
(Tesis inédita de maestría). Universidad Autónoma Querétaro.
Querétaro, México.

[6] Trujillo, F., García, G. (2021). Reconocimiento de palabras de la Lengua

de Señas Mexicana utilizando información RGBD. RECIBE 10(2).
DOI: https://doi.org/10.32870/recibe.v10i2.209

[7] Jin, M., Omar, Z. & Hisham M. (2016). A Mobile Application of

American Sign Language Translation via Image Processing Algorithms.
2016 IEEE Region 10 Symposium, DOI:
10.1109/TENCONSpring.2016.7519386

[8] CONADIS. (2016). Lengua de Señas Mexicana (LSM). Gobierno de

México. https://www.gob.mx/conadis/articulos/lengua-de-senas-
mexicana-
lsm?idiom=es#:~:text=La%20Lengua%20de%20Se%C3%B1as%20M
exicana,propia%20sintaxis%2C%20gram%C3%A1tica%20y%20l%C3
%A9xico, fecha de consulta: 13 de marzo de 2023.

[9] Calvo, M. T. (2004). Diccionario Español-Lengua de Señas Mexicana

(DIELSEME): estudio introductorio. Dirección de Educación Especial:
México.

[10] Tang, D. (2019). Empowering novices to understand and use machine

learning with personalized image classification models, intuitive
analysis tools, and MIT App Inventor. (Thesis, Massachusetts Institute
of Technology). https://dspace.mit.edu/handle/1721.1/123130, fecha de
consulta: 10 de noviembre de 2022.

[11] Torres, S., García, C., Cabeza, C. y Docío, L. (2020).

“LSE_Lex40_UVIGO: Una base de datos específicamente diseñada
para el desarrollo de tecnología de reconocimiento automático de LSE”.
Revista de Estudios de Lenguas de Signos REVLES, 2: 151-172.

[12] Teachable Machine. (2023)- ¿Qué es Teachable Machine?

https://teachablemachine.withgoogle.com/

[13] Yolo. (2023). YOLOv5: The friendliest AI architecture you'll ever use.
https:// https://ultralytics.com/yolov5.

[14] MediaPipe. (2023). Hand landmarks detection guide.

https://developers.google.com/mediapipe/solutions/vision/hand_landm
arker

[15] YoloV5. (2023). Yolo V5 Gihutb Repository.

https://github.com/ultralytics/yolov5

También podría gustarte

Cerco Prefabricado Costo Unitario Referencial
100% (1)
Cerco Prefabricado Costo Unitario Referencial
2 páginas
Dibujo Artistico para Sordos
Aún no hay calificaciones
Dibujo Artistico para Sordos
325 páginas
Manual DP DQ DR DS DT Spanish C134292.Sflb
83% (6)
Manual DP DQ DR DS DT Spanish C134292.Sflb
51 páginas
Educación - La Psicomotricidad
100% (1)
Educación - La Psicomotricidad
288 páginas
Adejetivos Demostrativos Tercero Básico
100% (2)
Adejetivos Demostrativos Tercero Básico
4 páginas
Trabajo de Lengua de Señas y Gestos
Aún no hay calificaciones
Trabajo de Lengua de Señas y Gestos
148 páginas
Hematologia
0% (1)
Hematologia
25 páginas
Guante Traductor de Lenguaje de Señas Mexicano
Aún no hay calificaciones
Guante Traductor de Lenguaje de Señas Mexicano
12 páginas
Corporacionn Real SAC
75% (4)
Corporacionn Real SAC
13 páginas
Tesis LSM FINAL
Aún no hay calificaciones
Tesis LSM FINAL
125 páginas
Traductor de Texto y Voz, A Lenguaje de Señas Ecuatoriana
Aún no hay calificaciones
Traductor de Texto y Voz, A Lenguaje de Señas Ecuatoriana
6 páginas
Tesis LSM
Aún no hay calificaciones
Tesis LSM
98 páginas
Technologies 12 00152
Aún no hay calificaciones
Technologies 12 00152
24 páginas
TFI - Palavecino Facundo Luis
Aún no hay calificaciones
TFI - Palavecino Facundo Luis
59 páginas
Lunes 04 Sesión PS Defensa Civil
Aún no hay calificaciones
Lunes 04 Sesión PS Defensa Civil
5 páginas
Tesis - Púrpura - La Fe de Erratas Como Bisagra para El Análisis Exhaustivo de Algunos Aspectos Estructurales de La LSU
Aún no hay calificaciones
Tesis - Púrpura - La Fe de Erratas Como Bisagra para El Análisis Exhaustivo de Algunos Aspectos Estructurales de La LSU
124 páginas
FORMATOS Reporte de Investigación
Aún no hay calificaciones
FORMATOS Reporte de Investigación
87 páginas
Sesion 2 Posicion Mediacionista de Charles Osgood PDF
0% (1)
Sesion 2 Posicion Mediacionista de Charles Osgood PDF
37 páginas
RBodmer
Aún no hay calificaciones
RBodmer
4 páginas
Introduccion A LSM.2021
Aún no hay calificaciones
Introduccion A LSM.2021
48 páginas
Presentación de Plan de Tesis
Aún no hay calificaciones
Presentación de Plan de Tesis
41 páginas
Reporte 08
Aún no hay calificaciones
Reporte 08
2 páginas
Empresa Plasticaucho
0% (1)
Empresa Plasticaucho
23 páginas
Reporte 07
Aún no hay calificaciones
Reporte 07
2 páginas
PROPUESTA
Aún no hay calificaciones
PROPUESTA
22 páginas
Aplicacion Que Traduce Texto
Aún no hay calificaciones
Aplicacion Que Traduce Texto
6 páginas
Tarea 02
Aún no hay calificaciones
Tarea 02
8 páginas
Autómatas Y Lenguajes Formales
Aún no hay calificaciones
Autómatas Y Lenguajes Formales
14 páginas
Artículo 87
Aún no hay calificaciones
Artículo 87
12 páginas
Proyecto de Tesis - Diego Viera Zegarra
Aún no hay calificaciones
Proyecto de Tesis - Diego Viera Zegarra
61 páginas
3-Anexo-1-Formato-de-Proyecto-de-Unidad-Receptora-2022 V0.3
Aún no hay calificaciones
3-Anexo-1-Formato-de-Proyecto-de-Unidad-Receptora-2022 V0.3
10 páginas
Los 6 Principios de Layout Enla Empresa
100% (1)
Los 6 Principios de Layout Enla Empresa
2 páginas
Manuscrito 74000 2 10 20231110
Aún no hay calificaciones
Manuscrito 74000 2 10 20231110
6 páginas
Protocolo de Investigacion 1
Aún no hay calificaciones
Protocolo de Investigacion 1
15 páginas
Ilide - Info Deteccion de Patrones PR
Aún no hay calificaciones
Ilide - Info Deteccion de Patrones PR
16 páginas
HandsTalk 2023 Documentacion 2 2
Aún no hay calificaciones
HandsTalk 2023 Documentacion 2 2
26 páginas
Tecnologías Del Lenguaje Aplicadas Al Procesamiento de Lenguas Indígenas en México: Una Visión General
Aún no hay calificaciones
Tecnologías Del Lenguaje Aplicadas Al Procesamiento de Lenguas Indígenas en México: Una Visión General
24 páginas
Presentación Propuesta Daniel Duarte
Aún no hay calificaciones
Presentación Propuesta Daniel Duarte
6 páginas
González - Sarah - S2 - Entregable 1
Aún no hay calificaciones
González - Sarah - S2 - Entregable 1
6 páginas
Proyecto de Servicio Social Autorizado
Aún no hay calificaciones
Proyecto de Servicio Social Autorizado
12 páginas
Diplomado en Lengua de Señas Mexicana
Aún no hay calificaciones
Diplomado en Lengua de Señas Mexicana
11 páginas
Linea 1 Temario Basico
Aún no hay calificaciones
Linea 1 Temario Basico
9 páginas
Traducción Lengua de Señas Informe
Aún no hay calificaciones
Traducción Lengua de Señas Informe
6 páginas
Presentación Paper
Aún no hay calificaciones
Presentación Paper
14 páginas
Berru NB
Aún no hay calificaciones
Berru NB
77 páginas
Extenso Enseña
Aún no hay calificaciones
Extenso Enseña
5 páginas
Estado Del Arte de Reconocimiento de Gestos Dactilológicos
Aún no hay calificaciones
Estado Del Arte de Reconocimiento de Gestos Dactilológicos
12 páginas
Detección de Patrones
Aún no hay calificaciones
Detección de Patrones
16 páginas
Ficha Morfologiasintaxiscomputacional Myt 2022 23
Aún no hay calificaciones
Ficha Morfologiasintaxiscomputacional Myt 2022 23
5 páginas
Tema 1 - Ejercicios (Medidas de Rendimiento)
Aún no hay calificaciones
Tema 1 - Ejercicios (Medidas de Rendimiento)
5 páginas
Diseno Torre Absorcion SO2
100% (1)
Diseno Torre Absorcion SO2
13 páginas
Capitulo Ii
Aún no hay calificaciones
Capitulo Ii
31 páginas
Informe - Sistemas
Aún no hay calificaciones
Informe - Sistemas
9 páginas
Traductor de Lenguaje de Senas
Aún no hay calificaciones
Traductor de Lenguaje de Senas
22 páginas
Articulo LSBv2-1
Aún no hay calificaciones
Articulo LSBv2-1
5 páginas
15FUA0522P LSM en Educación Básica RDE
Aún no hay calificaciones
15FUA0522P LSM en Educación Básica RDE
7 páginas
05-1 Segunda Ley de Newton
Aún no hay calificaciones
05-1 Segunda Ley de Newton
4 páginas
Procesamiento Lenguaje Natural Proyecto
Aún no hay calificaciones
Procesamiento Lenguaje Natural Proyecto
11 páginas
El Libertador Prometido
100% (1)
El Libertador Prometido
2 páginas
TAREA # 5 de Publicidad I
Aún no hay calificaciones
TAREA # 5 de Publicidad I
6 páginas
Sílabo - Promoción Comunal II - T - 2 - GREASSE - 240412 - 134743
Aún no hay calificaciones
Sílabo - Promoción Comunal II - T - 2 - GREASSE - 240412 - 134743
11 páginas
Plan de Manejo Parque Nacional Natural Old Providence McBean Lagoon
Aún no hay calificaciones
Plan de Manejo Parque Nacional Natural Old Providence McBean Lagoon
110 páginas
Lenguaje de Señas
Aún no hay calificaciones
Lenguaje de Señas
12 páginas
Características de Un Guatemalteco Borrador
Aún no hay calificaciones
Características de Un Guatemalteco Borrador
18 páginas
Tendencias en Productos de Valor Agregado A Partir de Extractos de Plantas
Aún no hay calificaciones
Tendencias en Productos de Valor Agregado A Partir de Extractos de Plantas
60 páginas
Tema Personal MANOS QUE HABLAN.
Aún no hay calificaciones
Tema Personal MANOS QUE HABLAN.
14 páginas
Manual M1 - Lengua de Señas Mexicana. Nivel Básico, Medio y Avanzado.
Aún no hay calificaciones
Manual M1 - Lengua de Señas Mexicana. Nivel Básico, Medio y Avanzado.
11 páginas
Untitled
Aún no hay calificaciones
Untitled
30 páginas
APUNTE - PLN Técnicas y Aplicaciones
Aún no hay calificaciones
APUNTE - PLN Técnicas y Aplicaciones
10 páginas
Seminario Lenguaje de Señas
Aún no hay calificaciones
Seminario Lenguaje de Señas
18 páginas
Guía Inducción
Aún no hay calificaciones
Guía Inducción
15 páginas
Estadistica Act.3
Aún no hay calificaciones
Estadistica Act.3
2 páginas
Extraer Contraseñas Del Correo y Redes Sociales.-sorGENS
Aún no hay calificaciones
Extraer Contraseñas Del Correo y Redes Sociales.-sorGENS
3 páginas
Yespeter Medina Fase 1
Aún no hay calificaciones
Yespeter Medina Fase 1
6 páginas
Producti 1. Mapa Conceptual
Aún no hay calificaciones
Producti 1. Mapa Conceptual
1 página
Proyecto - Traductor Automático Del Lenguaje de Señas A Texto y Voz
Aún no hay calificaciones
Proyecto - Traductor Automático Del Lenguaje de Señas A Texto y Voz
4 páginas
110 Usos de Los Aceites Diarios
Aún no hay calificaciones
110 Usos de Los Aceites Diarios
7 páginas
Extracción e Instalación de Los Ejes de La Mangueta Del Tensor Lateral y Los Sensores de Carga - tm611063 - Service ADVISOR™
Aún no hay calificaciones
Extracción e Instalación de Los Ejes de La Mangueta Del Tensor Lateral y Los Sensores de Carga - tm611063 - Service ADVISOR™
7 páginas
Unamirada 571
Aún no hay calificaciones
Unamirada 571
1 página
Curso de Introduccion A La Lengua de Señas Mexicana
Aún no hay calificaciones
Curso de Introduccion A La Lengua de Señas Mexicana
4 páginas
Bombas de Tornillo
Aún no hay calificaciones
Bombas de Tornillo
20 páginas
Ensayo Lenguas
Aún no hay calificaciones
Ensayo Lenguas
8 páginas
Ficha de Caracterización 2
Aún no hay calificaciones
Ficha de Caracterización 2
4 páginas
Tema Martes 18 D Emarzo
Aún no hay calificaciones
Tema Martes 18 D Emarzo
6 páginas
Quiste Oseo Subcondral
Aún no hay calificaciones
Quiste Oseo Subcondral
10 páginas
Psicologia
Aún no hay calificaciones
Psicologia
8 páginas
Planificación Tema1 Panorama Del Periodo (1) YA
Aún no hay calificaciones
Planificación Tema1 Panorama Del Periodo (1) YA
2 páginas
Artículo de La Lengua de Señas
Aún no hay calificaciones
Artículo de La Lengua de Señas
5 páginas
Actividad Autoevaluación Dermoestética
Aún no hay calificaciones
Actividad Autoevaluación Dermoestética
2 páginas
Narrativas tecnopedagógicas digitales
De Everand
Narrativas tecnopedagógicas digitales
Enrique Ruiz-Velasco Sánchez
5/5 (1)