MODELO FINAL ACÚSTICA FORENSE.
1) En un juicio oral Ud. es perito oficial. Un abogado de la defensa menciona que como se puede decir que
la voz de su cliente aparece en los audios peritados si uno mismo cuando se levanta, trabaja y llega el
final del día va teniendo cambios en la voz, explique qué es la voz, cómo se llama este hecho
mencionado y por qué pese al mismo las pericias de voz se hacen y se le ha tomado rasgo biométrico
confiable. (1.5 puntos)
La voz es un fenómeno físico-acústico anatómico- fisiológico, fonológico lingüístico.
El hecho mencionado es variabilidad intra hablante, que es la variabilidad del habla que tiene una persona durante su
habla en un lapso.
Rasgo biométrico confiable porque es medible, evaluable, distintivo, invariable, universal.
2) Distinga entre grabación íntegra, auténtica, precisa y original según el documento AES 27-1996 (r2007)
de la Audio Engineering Society.
Grabación íntegra: soporte de grabación o una parte que tenga continuamente, los sucesos acústicos capturados
por un sensor y grabador.
Grabación precisa: soporte de grabación o una parte que contenga, los sucesos acústicos capturados por un sensor
y grabador, desviándose en los límite y si se exceden, son indicios de ediciones o manipulaciones.
Grabación auténtica: la grabación es verosímil a juicio y decisoria y la Autoridad Judicial puede juzgar.
Grabación original: soporte de grabación o una parte que contenga los sucesos acústicos capturados por un sensor
y registrados en que la señal acústica se reprodujo.
3) Mencione 2 situaciones en que un audio no puede ser apto para cotejo por match de formantes,
que requeriría para ser analizado por método aural y explique qué parámetros suprasegmentales deben
analizarse por método de Hollien (1,5 puntos)
Un audio no es apto para cuando tiene -14 segundos de habla continua o cuando no visualizo la tercera formante.
Método AURAL: +30 seg para análisis aural robusto, señal ruido de 10 DB, la reverberación -400 ms, tener un Cepstrum
continuo y no tener Clipping.
Método de Hollien identifica a un individuo en base a su discurso cuando NO se conoce su identidad y podría pertenecer a
una población amplia.
Los parámetros suprasegmentales son tono, calidad de la voz, intensidad, resonancia, articulación, prosodia.
De todo esto, se saca un promedio y luego se hace un audio único con las dos voces para compararlas.
4) Al realizar una pericia el equipo de acústica Forense determina que el LR de los audios es de 375.
En base al concepto de LR y la tabla presentada en clase, redacte la conclusión de la investigación para
ser presentada al magistrado. (1,75 puntos)
Los LR son la probabilidad de que la evidencia del imputado o de otra persona en base de datos. Cuando al LR le calculas el
logaritmo, cambia a un número grande, dando el FORENSIA, es decir, el LLR.
Conclusión: El resultado indica que 375 es certeza moderada.
5) ENUNCIE LOS PASOS INVESTIGATIVOS PARA LA SIGUIENTE PERICIA. Clasificarla (2 puntos)
Se reciben 2 CD con conversaciones de WhatsApp y un CD con la grabación indagatoria de Antonio
López realizada por el juzgado de Lomas de Zamora.
1. Recepción del material.
2. Digitalización.
3. Código hash.
4. Copia.
5. Separar las voces de interés.
6. Aptitud técnica.
7. Cotejo.
8. Conclusiones.
Clasificación: identificación.
6) Al iniciar la etapa de aptitud técnica para una pericia de cotejo se observa el siguiente
espectrograma de un audio. Suponiendo que las cuestiones administrativas ya están cubiertas. Qué tipo
de espectrograma es, qué se estaría indicando en la zona recuadrada y qué indicaría hacer desde el
punto de vista pericial. (y por qué) con dicho audio en general ? (2 puntos)
El espectrograma es del tipo BANDA ANCHA, la zona recuadrada indica superposición de voces. Al audio habría que
descartar la superposición de voces, recortar, extraer de las voces de interés, posterior al código hash y recortar donde
están los formantes.
FINAL 1.
1) En un juicio oral el magistrado solicita saber por qué la voz registrada en una grabación puede tomarse
como evidencia para determinar la participación de ciertas personas en un caso de tráfico de armas.
Explique desde el punto de vista de la voz como rasgo biométrico, a qué tipo de biometría pertenece y
los niveles de robustez que pueden lograrse analizándola.
Rasgo biométrico confiable porque es medible, evaluable nivel de robustes es bajo, distintivo nivel de robustez es bajo,
invariable el nivel de robustez es mediano y universal el nivel de robustez es mediano.
Pertenece al tipo de biometrías dinámicas.
2) Un abogado interpreta el informe de un perito diciendo la probabilidad de que la voz de una persona
cualquiera sea la registrada en las grabaciones analizadas es de 1 en 1000. La voz registrada en dichas
grabaciones concuerda con las del Sr Javier Pérez. Entonces, la probabilidad de que Javier Pérez no haya
participado en las escuchas es de 0,001. Es decir, la probabilidad de participación es de 0.999. Este tipo
de razonamiento se conoce como Falacia del Fiscal. Explique y exprese correctamente los resultados de
una pericia de voz.
Esta afirmación está mal ya que el LR es el cociente entre 2 probabilidades, y la correcta interpretación es si el resultado
indica que es 0.001, hay una falta de certeza para decir que la evidencia provenga del Sr. Javier Pérez. Esta relación de se
da entre la probabilidad de que la evidencia prevenga del sospechoso sobre la probabilidad de que provenga de cualquier
persona, en el caso de que el resultado fuera 1000 el nivel de certeza sería alto y coincidiría con el Javier Pérez.
3) ¿Cuál es la diferencia entre armónico y formante de la voz? ¿Cuál de estas últimas se advierten en una
voz normal y que puede hacerse pericialmente si se visualizan correctamente?
A. F1 y F2
B. F1, F2, F3 y F4
C. sólo F3
Los armónicos son múltiplos enteros de la F0, mientras que las formantes son picos de resonancia.
a) F1 y F2: reconocimiento, porque son modificables
b) F1, F2, F3/F4: identificación del match de formantes.
c) F3: no puede existir F3 si no están visibles F1 y F2.
FINAL 2.
1) El magistrado te mandaba 7 casetes y que había que tomar el cuerpo de voz de 2 mujeres. Explicar los
pasos a realizar en la pericia
1. Recepción del material.
2. Digitalización.
3. Código hash.
4. Copia.
5. Separar las voces de interés.
6. Aptitud técnica.
7. Cotejo.
8. Conclusiones.
2) Sobre Koval y el Match de formantes, con dos imágenes de espectrograma q había q poner la vocal.
FINAL 3.
1. ¿Se puede realizar un cotejo de voz entre una voz modulada y la fonoteca por ejemplo de la PFA?
2. Habla modulada o voces electrónicas : habla alterada o manipulada para distorsionar la identidad del hablante
original. NO SON VOCES, NO SE PUEDE HACER PERICIAS no hay estructura ósea que genere las vibraciones.
3. El método de Sergey Koval automático.
Sirve para la identificación de un hablante a través de fonogramas de habla. Se evalúa la similitud entre un primer fonograma
del hablante y un
segundo fonograma, o una muestra, igualando las frecuencias formantes de una señal de voz.
● Las referencias incluyen caminos formantes de por lo menos tres frecuencias formantes, en donde las dos primeras están
dentro de los límites
típicos de variabilidad para el fonema de esa vocal. Las referencias seleccionadas son comparadas entre sí, incluyendo al
menos dos frecuencias
formantes idénticas. Se evalúa la similitud de las referencias comparadas, donde se determina la similitud los fonogramas.
● Coincidencia de voces y vocales dentro del 5% de variabilidad intra hablante.
De acuerdo con el método de macheo de formantes propuesto por Koval, la correspondencia positiva entre voces puede
establecerse a partir de: La
concordancia de valores formanticos para F1 F2 F3 y F4 para cada vocal entre 5 /8 comparaciones.
El Match de Formantes es una técnica utilizada en la acústica forense para comparar y analizar las características de
formantes en grabaciones de voz. Los formantes son picos de energía en el espectro de frecuencia de una señal de voz y están
relacionados con las resonancias de las cavidades del tracto vocal humano. Estas características son únicas para cada persona
y pueden utilizarse para identificar y comparar diferentes voces.
En la acústica forense, el Match de Formantes se utiliza para determinar si dos grabaciones de voz provienen de la misma
persona o para comparar una muestra de voz desconocida con grabaciones conocidas de un sospechoso. Los formantes son
analizados mediante técnicas de procesamiento de señales y se comparan los valores y las posiciones de los picos de energía
en el espectro.
FINAL 4.
1. El abogado conjetura que como es una copia no sería válido utilizarlo para análisis. Respuesta: explicar por
qué se hace la copia, el código de hash, porque es importante no trabajar sobre el original .
Luego de la recepción el material, se hace una copia de los elementos para no dañar la muestra y hay que tener el back up del
original. Se realiza una copia digital del audio con misma calidad del para realizar el cotejo, manteniendo el original sin
modificaciones.
El código Hash un código alfanumérico que forma parte de todos los archivos, donde cualquiera que lo modifique al original,
también modificara el Hash. Esto se utiliza para verificar el hash que tienen los audios que se transmiten, y ver si hay
correspondencia o se corrompió el archivo. Si nosotros generamos el hash del original y lo comparamos con el hash de la copia
antes de comenzar a trabajar con ella, será el mismo.
FINAL 5.
1. Cierto magistrado solicita que se evalúe la manipulación digital del audio de una conversación telefónica.
Explique según el documento AES27-1996(r2007) de la Audio Engineering Society (AES) que respuestas
podría dar a este requerimiento (1,25 PUNTOS)
Examinar cortes o alteraciones en el tiempo.
Buscar ruido inusual o anomalías indicando manipulación.
Comparar el material sospechoso con grabaciones originales conocidas.
Buscar patrones de repetición que indican pregrabados o copiados.
Ediciones abruptas que identifica cambios en el audio que indican ediciones.
2. Explique el fenómeno físico de resonancia, qué relación tiene con los armónicos, la frecuencia fundamental
y el método de Sergey Koval para la identificación objetiva de la voz (2 PUNTOS)
La resonancia es un fenómeno de aumento de amplitud que ocurre cuando la frecuencia de una fuerza periódica aplicada es
igual o cercana a la frecuencia natural del sistema en el que actúa.
En la glotis, que es el espacio que queda entre los dos pliegues vocales genera una onda quasiperiódica y con esa vibración,
genera una frecuencia fundamental del tracto vocal. A esa frecuencia fundamental, luego va a generar por resonancia
frecuencias múltiples de ese sonido puro que genera el tracto, que es la definición de armónico, son sonidos, periódicos y
puros, múltiplos enteros de la frecuencia fundamental que genera una determinada caja de resonancia. Estos armónicos son
los que nos van a permitir la identificación.
Los armónicos son los parámetros que generan el timbre característico (F0) de una fuente de sonido incluida, por ejemplo,
la voz humana. Algunos armónicos son puestos en relieve por el tracto vocal. Dichas agrupaciones de armónicos reciben el
nombre de formantes del habla cuya visualización es óptima con un espectrograma de banda ancha.
Los formantes del habla son picos de mayor resonancia natural del tracto vocal de cada individuo determinadas por la
anatomía cráneo facial y permiten la identificación.
El método de Sergey Koval esta intrínsecamente relacionado con estos mismos debido a que este compara y evalúa a través
del análisis objetivo de la voz la similitud entre voces según los formantes del habla.
3. Tipos de espectrogramas.
Espectrograma de banda estrecha: visualización de armónicos y frecuencia fundamental (F0).
Espectrograma de banda ancha: visualización de F1, F2, y F3 para cada sonido vocálico.
Cepstrum: visualización de frecuencia fundamental (F0).
4. El cociente de verosimilitud puede calcularse como el cociente entre la similitud/tipicidad. Explique estos
dos conceptos y su relación con las bases de datos en la interpretación de resultados en una pericia
forense de voces (1,75 PUNTOS)
Los LR son la probabilidad de que la evidencia del imputado o de otra persona en base de datos. Cuando al LR le calculas el
logaritmo, cambia a un número grande, dando el FORENSIA, es decir, el LLR.
Similitud: cuan parecida la evidencia se parece a la del imputado.
Tipicidad: cuanto el imputado se parece a las voces del resto del universo en una base de datos.
FINAL 6.
1. Según el protocolo, que tenés que hacer con la factibilidad y relacionarlo con los ruidos de fondo y la
contemporaneidad.
La factibilidad es un análisis de una muestra de audio, evaluando si las condiciones del material de audio son suficientes en
calidad y cantidad de tiempo neto del habla. Si el audio es factible de cotejo, se obtiene la muestra indubitada para realizar el
cotejo de voces.
Se realiza la factibilidad sobre el cuestionado/dubitado para saber si la muestra cumple con los patrones de calidad y cantidad.
Audios no-contemporáneos: evaluar si es factible realizar el cotejo cuando las muestras dubitadas tengan una
antigüedad superior a 7 años.
Diferencia de dialecto o idioma: documentar las diferencias de sociolecto, idiolecto, regiolecto o acento y el tipo de
lenguaje.
Relación señal-ruido: asegurar que la señal no deseada en el material no interfiera con la muestra de interés,
excediendo el límite tolerable
Distorsión del material: analizar los elementos en la cadena de audio que tienen distorsión al material.
2. Te da un espectrograma, tenías que poner qué tipo de espectrograma era y eran dos vocales, decir cuáles
eran según la distancia entre formantes, según Koval como se trabajaba.
Koval utiliza el espectrograma de LPC (espectro de predicción lineal) que dibuja la envolvente de las formantes en el
espectrograma de banda ancha y ve si las formantes machean o no cotejando y superponiendo las formantes. Si coinciden
los picos de formantes en una variabilidad del 5%, las formantes son de muestra. Con un 70% de coincidencias coincide con
la misma persona.
3. Enuncie los pasos de una pericia con 7 casetes de hace 15 años y dos cuerpos de voz de dos mujeres.
La frecuencia varía y es estacionaria luego de la menopausia y 15 años no cumple la contemporaneidad. El patrón de voz es
un patrón estable, pero sufre variaciones, con 7 años ya se debe hacer un análisis más profundo a haber si el audio es apto o
no, si es de hasta 5 años es contemporáneo y en caso de que cumpliera con la contemporaneidad, se organiza cada cassete
para su posterior análisis.
4. Mencionar las pericias que se pueden hacer de acústica balística. Qué puntos de análisis podrían lograrse
en una pericia de acústica de disparos.
5. Autenticidad de una muestra, como que se pidió una pericia de autenticidad y que dice la entidad de los
estados unidos al respecto
Autentica: grabación que es verosímil a juicio de la autoridad judicial. Se trata de un concepto que esta fuera del
alcance de un experto forense porque su naturaleza es decisoria y sobre una cualidad de algo sobre la que solo la
autoridad judicial puede pronunciarse.
6. Teorías de la fonación.
Teoría aerodinámica mioelástica: las cuerdas vocales son pasivas y vibran cuando pasa el aire en la glotis por la
presión que se produce debajo de ese interciso entre los pliegues vocales y la tensión que generen los músculos sobre
los cartílagos de las cuerdas.
Teoría neurocronáxica: los pliegues son activos y la presión infraglótica que se produce por respirar, el cerebro es el
que activa la vibración de esos pliegues y descubre que existía una mucosa recubriendo los pliegues vocales.
Teoría mucoondulatoria y mioelástica perfeccionada: lo que vibran no son los pliegues vocales, sino la membrana
o la mucosa que cubre los pliegues.
Teoría osciloimpedancial: el modelo de funcionamiento fonador se parece a un armónico simple, algo que oscila como
un armónico simple y eso permitió generar un modelo digital de como hablamos.