Capítulo 1. La Estadística y su utilización en la investigación.
Capítulo 1
LA ESTADÍSTICA Y SU UTILIZACIÓN EN LA
INVESTIGACIÓN
1.1 Introducción.
A medida que aumenta la complejidad de nuestro mundo, se hace cada vez más
difícil tomar decisiones inteligentes y bien documentadas. Con frecuencia tales
decisiones deben tomarse con mucho menos que un conocimiento adecuado y
experimentando una gran incertidumbre. Sin embargo, las soluciones a estos
problemas son esenciales para nuestro bienestar e incluso para nuestra supervivencia
final. Continuamente estamos recibiendo presiones debido a problemas económicos
angustiosos como una inflación galopante, el sistema tributario engorroso y
oscilaciones excesivas en el ciclo empresarial. Todo nuestro tejido económico y
social está amenazado por la contaminación ambiental, la deuda pública onerosa, la
tasa de criminalidad que siempre va en aumento y las impredecibles tasas de interés.
Esta unidad aportará una visión general sobre lo que es la estadística y cómo puede
utilizarse. Esta visión general sobre la naturaleza de la estadística y los beneficios
que puede proporcionarnos se efectuará revisando:
Las definiciones básicas de las herramientas estadísticas.
Cómo llevar a cabo el muestreo para realizar análisis estadísticos.
Las funciones que cumple la estadística.
Cómo puede ayudar la estadística en la investigación.
Comencemos con una breve exposición del papel significativo que juega la
estadística en la investigación.
1.2. La importancia de la estadística.
Para quienes están en el área de la investigación de mercados, la estadística es de
gran ayuda en el momento de determinar qué tan probable es que un producto nuevo
sea exitoso. La estadística también es muy útil para evaluar las oportunidades de
inversión por parte de asesores financieros. Los contadores, los jefes de personal y
los fabricantes encuentran oportunidades ilimitadas de beneficiarse con el uso del
análisis estadístico. Incluso un investigador en el campo de la medicina, interesado
en la efectividad de un nuevo medicamento, considera la estadística una aliada
imprescindible.
1.3. La Estadística en la Investigación Científica
Existe un consenso en la idea de que la Estadística es una herramienta fundamental
para la investigación científica. De ahí, que casi todas las carreras universitarias,
incluyan en sus planes de estudios asignaturas de contenido estadístico. Sin embargo,
la Estadística trasciende el contexto académico y está presente en distintos ámbitos
de la actividad humana. Si examinamos el sentido que popularmente se da a la
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 2
Estadística, encontramos que la opinión pública está más familiarizada con cifras
estadísticas, tales como los resultados de comicios electorales, la evolución del índice
de precios al consumidor (IPC), las estadísticas de un partido de futbol, etc..
La Estadística es una ciencia necesaria en todas las investigaciones experimentales y
no experimentales (observacionales). Su correcta aplicación, desde el momento
inicial de la investigación, garantiza resultados altamente confiables y el éxito de la
misma. Es decir, que la Estadística debe estar presente desde el principio hasta el
final, es decir desde la formulación misma del problema hasta la obtención de las
conclusiones finales de la investigación, motivo por el cual los investigadores o
equipos de investigación deben contar con el apoyo de un profesional Estadístico
competente.
1.3.1. El Estadística en el Proceso de Investigación Científica.
Habitualmente se acepta que la Estadística resulta ser una herramienta de trabajo, útil
en la investigación científica en la medida en que ofrece técnicas y procedimientos
que pueden ser aplicados en la etapa de análisis de datos; sin embargo también es útil
en otros momentos del proceso de investigación. A continuación mostramos los más
importantes
a) La Estadística está presente en la formulación del problema de
investigación. La formulación del problema determinará en buena medida el tipo de
datos que es necesario recoger, las técnicas de recogida adecuadas para ello y los
procedimientos estadísticos que se utilizarán en el análisis. Por otra parte, entre las
características que debe poseer cualquier problema de investigación se encuentra su
resolubilidad, aspecto que a veces sólo queda garantizado si contamos con técnicas
estadísticas adecuadas, capaces de abordar los interrogantes de partida. Por ejemplo,
el planteamiento de problemas que supongan comparaciones entre dos grupos no
podría hacerse sin contar con técnicas como la prueba t de Student (Prueba
paramétrica) o comparaciones entre múltiples grupos con técnicas como el análisis
de la varianza; un gran número de problemas de investigación en los que se incluyen
múltiples dimensiones o variables simultáneamente de hecho no han llegado a ser
estudiados hasta contar con técnicas de análisis multivariante que permiten
abordarlos.
b) La presencia de la Estadística en la formulación de hipótesis. La formulación
de hipótesis no puede hacerse de espaldas a consideraciones acerca de las técnicas
estadísticas que permitirán su contrastación. En el marco de los programas de
investigación positivistas (aquellas investigaciones que tienen un enfoque
metodológico predominantemente cuantitativo) la hipótesis científica, para ser
contrastada, suele ser expresada en términos estadísticos, dando paso a la aplicación
de técnicas para el contraste de hipótesis. En el planteamiento del problema y la
posterior formulación de hipótesis han de tenerse en cuenta los trabajos previos
realizados sobre el mismo tema.
c) La Estadística forma parte de los diseños de investigación. Un diseño es un
plan o estrategia que se desarrolla para obtener la información que se requiere en una
investigación.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 3
En el concepto de diseño es posible contemplar de un lado la organización de los
aspectos que constituyen el experimento y, de otro, el procedimiento estadístico que
hará posible la interpretación de los resultados. Las técnicas estadísticas constituyen
una parte contemplada en el diseño del experimento en la medida en que facilitarán
el análisis de los datos y posibilitarán el control de la varianza debida a variables
extrañas. Si dentro del diseño del experimento se consideran grupos experimentales y
grupos control, que antes de la aplicación de los tratamientos han de ser equivalentes,
el investigador necesitará recurrir a técnicas estadísticas para el contraste de hipótesis
acerca de la existencia de diferencias entre los grupos y comprobar de ese modo la
equivalencia pretendida.
En las referencias bibliográficas sobre la investigación cuantitativa es posible
encontrar diferentes clasificaciones de los diseños. En esta asignatura vamos a
mencionar la siguiente clasificación de diseños: Investigación experimental e
investigación no experimental.
Cada uno posee sus características, y la decisión sobre qué clase de investigación y
diseño específico hemos de seleccionar o desarrollar depende del planteamiento del
problema, el alcance del estudio y las hipótesis formuladas.
Figura 1.1. Tipos de diseños de investigación
En una investigación no experimental, no se manipulan deliberadamente las
variables y en los que sólo se observan los fenómenos en su ambiente natural para
después analizarlos.
Ejemplos: Un investigador desea evaluar los niveles de satisfacción de los clientes de
un hotel respecto al servicio que reciben. (Es un tipo de diseño transversal
descriptivo)
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 4
Se desea determinar como el clima organizacional influye en el desempeño del
trabajo en una determinada empresa (es un tipo de diseño transversal correlacional-
causal).
Figura 1.2. Tipos de diseños no experimentales.
En una investigación experimental, se manipulan de manera intencional, una o
más variables independientes (supuestas causas) para analizar las consecuencias
de tal manipulación sobre una o más variables dependientes (supuestos efectos),
dentro de una situación de control para el investigador.
Causa Efecto
(Variable independiente) (Variable dependiente)
X Y
Figura 1.3. Esquema de experimento y variable
Por ejemplo, tenemos:
Problema: Rentabilidad Financiera es negativa en los últimos 2 meses
Solución: Implementar el programa de control de costos y gastos.
Después: Rentabilidad Financiera aumenta significativamente.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 5
PROBLEMA:
Rentabilidad Financiera es PRETEST: Demostrar
negativa en los últimos 2 meses.
SOLUCIÓN: ESTIMULO O
Implementar el programa de TRATAMIENTO Implementar
Control de Costos y Gastos EXPERIMENTAL
DESPUÉS:
Rentabilidad Financiera aumenta POST TEST: Efecto
significativamente.
Figura 1.4. Esquema del diseño experimental para el ejemplo
Los diseños experimentales puede dividirse en: Experimentos “puros”,
Preexperimentales y Cuasiexperimentales.
Figura 1.5. Tipos de diseños experimentales
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 6
A manera de resumen presentamos en la figura 1.6, los tipos de diseño de
investigación para una investigación cuantitativa, los niveles de investigación (según
su grado de profundidad y alcance) y los tipos de enfoques.
Tipo de diseño Niveles de investigación Enfoque
Aplicativo
Experimental Predictivo
(con intervención) Cuantitativas
Explicativo (Aplicación de
herramientas
estadísticas )
Relacional o correlacional
No experimental Descriptivo
(sin intervención)
Cualitativas
Exploratorio
(No aplicación
de herramientas
estadísticas )
Figura 1.6. Tipos de diseños experimentales, niveles de investigación y enfoques de
investigación.
d) Además, la Estadística está presente cuando el diseño incluye la selección de
sujetos. La teoría de muestras proporcionará tanto los procedimientos de selección
como la determinación del tamaño muestral necesario para mantener el error y la
confianza dentro de límites aceptables.
e) La recolección de datos es una tarea en la que aparentemente no parecen
jugar un papel las técnicas estadísticas. Sin embargo, la Estadística está de manera
implícita presente si consideramos el modo en que se elaboran los instrumentos
utilizados para la recogida de datos (tests, cuestionarios, protocolos de observación,
etc.). A esta disciplina corresponde un papel crucial en la construcción de tales
instrumentos, dado que las técnicas estadísticas están en la base de los
procedimientos por los cuales se analizan sus características técnicas. Por citar
algunos ejemplos, la determinación de la confiabilidad de algunos instrumentos se
apoya directamente en coeficientes de correlación; la aplicación de técnicas de
análisis de componentes principales o análisis factorial permite explorar o confirmar
la dimensionalidad de los instrumentos; los métodos para el análisis de ítems, en la
teoría de respuesta al ítem, se basan en correlaciones.
f) La importancia de las técnicas estadísticas en el análisis de datos. Es
innegable la importancia de las técnicas estadísticas en la fase de análisis de datos.
De acuerdo con el concepto de Estadística que hemos presentado, a la Estadística
corresponden tareas de organización, descripción, análisis y presentación de datos
acerca de las muestras estudiadas, y también de generalización de los resultados a las
poblaciones de donde las muestras fueron extraídas. El análisis estadístico de los
datos supone una descripción de éstos, el descubrimiento de regularidades y la
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 7
inferencia de características relativas a conjuntos más amplios que los directamente
estudiados.
g) Obtención de conclusiones y redacción del informe
La estadística nos proporciona herramientas que formalizan y uniforman nuestros
procedimientos para sacar conclusiones. De alguna forma, las conclusiones están
predeterminadas por el tipo de técnicas estadísticas que utilicemos. Un análisis de
regresión, por ejemplo, nos permitirá obtener conclusiones acerca de la posibilidad
de que determinadas variables independientes puedan predecir el valor observado en
una variable dependiente; un análisis de conglomerados nos llevará a concluir sobre
formas de agrupamiento entre los individuos u objetos que estudiamos; un análisis
simple de la varianza supondrá llegar a conclusiones acerca de las diferencias
significativas entre las medias de diferentes grupos; etc. En cualquier caso, la
Estadística estará presente a la hora de elaborar las conclusiones, aportando las
claves para la interpretación de los resultados del análisis.
La presentación de las conclusiones, así como de todo el proceso de investigación,
debe contar con la inclusión de resultados estadísticos. Aunque no se trata de una
aplicación de técnicas estadísticas en el momento de redactar el informe, sí que la
Estadística está de algún modo presente a la hora de mostrar los resultados. Las
conclusiones de un estudio se verán convenientemente ilustradas mediante la
presentación de tablas, cuadros, etc. recogiendo medias, porcentajes, correlaciones, o
cualquier otro tipo de estadísticos.
1.4. Algunas definiciones básicas.
Toda rama de la investigación científica tiene su vocabulario propio y la estadística
no es la excepción. Esta sección revisa algunos de los términos comunes utilizados
en el análisis estadístico. Las definiciones y expresiones que siguen son esenciales
para la comprensión de cómo se realizan las pruebas estadísticas.
1.4.1. Universo. Se denomina universo, a un conjunto de elementos (que consiste de
personas, objetos, etc.) que contienen una o más características observables de
naturaleza cualitativa o cuantitativa que se pueden medir en ellos.
1.4.2. Unidad elemental. A cada elemento de un universo se denomina unidad
elemental.
Por ejemplo, los empleados de una empresa en un día laborable, constituyen un
universo en la que cada empleado (unidad elemental), tiene muchas características a
ser observadas, como por ejemplo: sexo, estado civil, lugar de procedencia, grado de
instrucción, etc. (característica cualitativa), o número de hijos, ingresos mensuales,
etc. (característica cuantitativas).
El resultado de medir una característica observable de una unidad elemental, se
denomina dato estadístico o valor observado o simplemente observación.
1.4.3. Población. Por otra parte, el universo viene definido por la investigación
estadística a realizarse. Y como la medición de la característica especificada por la
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 8
investigación se hace a cada unidad elemental, se puede considerar a la población
como el conjunto de medidas o el recuento de todos los elementos que presentan una
característica común especificada por la investigación estadística. El termino
población se usa para denotar el conjunto de elementos del cual se extrae la muestra.
Si los ingresos de los 121 millones de asalariados de los estados Unidos son de
interés para un economista que asesore al Congreso en la formulación del plan
nacional tributario, entonces 121 millones de asalariados constituyen el universo.
Por otro lado, los 121 millones de ingresos constituyen la población.
Si se está considerando un plan tributario para los perceptores de ingresos superiores
a US $100,000, entonces estos perceptores constituyen el universo, y tales ingresos
superiores a US $100,000 constituyen la población.
1.4.4. Marco muestral. Se denomina marco muestral o marco de referencia, a la
lista, mapa o cualquier otro material aceptable, que contenga todas las unidades o
elementos perfectamente identificados y actualizados, de la cual se selecciona la
muestra.
1.4.5. Características. Es importante resaltar el hecho de que a pesar de encontrarse
una población constituida por un grupo de elementos o unidades, a la estadística no
le interesa el elemento o la unidad en sí, sino su característica.
Estos son algunos ejemplos de lo que podrían denominarse elementos de una
población y características de la misma.
Elementos Características
Personas Salarios
Personas Horas trabajadas
Personas Cargos
Departamentos Ventas
Hogar Consumo
Las características (o caracteres), corresponden a ciertos rasgos, cualidades o
propiedades que poseen los elementos que constituyen la población o la muestra.
1.4.6. Muestra. Es un conjunto de medidas de una parte de los elementos
pertenecientes a la población, con el fin de obtener información acerca de la
población de la cual proviene. La muestra debe ser seleccionada de manera que sea
representativa de la población. Para que una muestra sea representativa de la
población se requiere que las unidades sean seleccionadas aleatoriamente o al azar
(es decir, todos los elementos que componen la población tienen la misma
posibilidad de ser seleccionados); ya sea utilizando métodos tales como: el sorteo, las
tablas de números aleatorios, la selección sistemática o cualquier otro método que
sea al azar.
Una muestra no probabilística corresponde a la selección de las unidades o
elementos, según el criterio o conveniencia del investigador. En estos casos, algunas
unidades tienen mayor posibilidad que otras de ser seleccionadas; por tal razón no se
puede determinar la validez, ni la confianza que merecen dichos resultados. Casi por
lo general, las unidades se seleccionan en forma caprichosa, voluntaria, por cuotas,
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 9
tal como sucede en las encuestas de opinión, que en la mayoría de los casos no tienen
credibilidad, de ahí que se le conozca como Muestra circunstancial.
Las muestras son necesarias porque estudiar las poblaciones completas resulta muy
costoso y demanda mucho tiempo examinar la población total, calcular el estadístico
de la muestra, y utilizarlo para estimar el parámetro correspondiente de la población.
Con mucha frecuencia se comprueba que la muestra no es del todo representativa de
la población y resultará un error de muestreo. El error de muestro es la diferencia
entre el estadístico de la muestra utilizada para calcular (estimar) el parámetro de la
población y el valor real pero desconocido del parámetro.
1.4.7. Parámetro. Es una medida que describe numéricamente una característica de
una población, tal como la media ( ) o la varianza (2 ). También se le denomina
valor verdadero, ya que una característica poblacional tendrá un solo parámetro
(media, varianza, etc.). Sin embargo, una población puede tener varias características
y, por tanto, varios parámetros. Algunos lo denominan como valor estadístico de la
población. Algunos ejemplos son: el ingreso promedio ( ) de todos los asalariados
de Perú, o la producción total (Y) de todas las plantas manufactureras. El punto
clave para recordar es que un parámetro describe una población.
1.4.8. Estadística o estadígrafo: La descripción numérica de una característica
correspondiente a los elementos de una muestra aleatoria, se denomina estadígrafo,
tal como la media ( X ) o la varianza (S2 ) muestral. De una población se pueden
obtener M número de muestras posibles y en cada una de ellas se puede cuantificar la
característica, obteniéndose por lo general, valores diferentes para cada muestra, a
pesar de ser utilizado el mismo estadígrafo o medida.
El ingreso promedio de esos varios miles de trabajadores, calculado por el Ministerio
de trabajo, es un estadístico. El estadístico es a la muestra lo que el parámetro es a la
población. El estadístico sirve como una estimación del parámetro. Aunque en
realidad el interés se fija en el valor del parámetro de la población, con frecuencia
debe haber conformidad con sólo calcularlo con un estadístico de la muestra que se
ha seleccionado.
1.5. Variables Estadísticas.
Los elementos de análisis de la estadística son las variables, características medidas
en los sujetos de estudio, que pueden adoptar una serie de valores posibles, pero cuyo
valor concreto en cada sujeto u observación es a priori desconocido.
Definición: Se denomina variable estadística a toda característica medida en un
estudio, cuya medición se realice en números (variables cuantitativas: edad o peso) o
en categoría (variables cualitativas o categóricas).
Se denomina variable porque, aunque podemos prever los valores posibles, el valor
observado en un momento dado en un individuo, grupo, comunidad o población es
cambiante. Por ejemplo, podemos prever que los valores posibles del sexo de un
nuevo recién nacido pueden ser masculino o femenino, pero hasta que no
observamos al nuevo recién nacido no podemos asegurar cuál de ellos es. En ese
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 10
ejemplo la unidad de observación es el recién nacido, y el conjunto de valores
posibles del sexo de recién nacidos la muestra de estudio.
Se representa por una letra del alfabeto. Por ejemplo, en el universo constituida por
los trabajadores administrativos de la universidad Nacional de Piura, algunas
variables estadísticas definidas en ésta población son:
X: "Género". Valores: Masculino, Femenino
Y: "Estado civil". Valores: Soltero, casado, viudo, divorciado
Z: "Número de hijos", Valores: 0,1, 2, etc.
W: "Ingresos mensuales", Valores: Números reales positivos.
Si una variable se denota por X, entonces, sus valores observados en n unidades
estadísticas se denotan por x1 , x2 ,..., x n , conforme al orden en que se han obtenido.
Este conjunto de n observaciones constituye una muestra de tamaño n obtenida de
una población.
Aunque la mayoría de las variables de uso frecuente pueden ser de fácil
comprensión, existen otras que no lo son y, por lo tanto, requerirán una definición
operativa. Dicha definición incluirá el rango de valores posibles y la definición de
cada uno de ellos. Veamos un ejemplo: evolución de una enfermedad. Podemos
definir como valores posibles: curación (desaparición de síntomas), mejoría
(disminución de la intensidad de los síntomas), persistencia o empeoramiento
(persistencia o empeoramiento de síntomas).
1.5.1. Tipos de variables
Las variables pueden ser clasificadas de diferentes maneras. Se pueden clasificar
teniendo en cuenta a su naturaleza y en función de diversas características (tabla 1.1):
su papel en la pregunta de investigación, el número de posibles valores y su escala de
medición. Es importante conocer las características de las variables ya que van a
condicionar su recogida y análisis. Cuando presentemos los distintos test estadísticos
comprenderemos la trascendencia del tipo de variables en la elección de los mismos.
Tabla 1.1. Tipos de variables
Cuantitativas
Según su naturaleza Cualitativas
Dependiente (respuesta)
Según su papel en la pregunta de investigación: Independiente (explicativa)
Continuas
Según el número de valores posibles: Discretas
Nominal (dicotómicas, politómicas)
Según su escala de medición Ordinal
De intervalos (Continuas o de escala)
De razones (Continuas o de escala)
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 11
a. Según su naturaleza.
Las variables se clasifican en dos grupos de acuerdo al nivel de medición utilizado
para su observación: cualitativas y cuantitativas.
Variable cualitativa o atributo, es la característica cuyos valores no puede ser
expresada numéricamente. Por ejemplo, “Rendimiento académico” puede adoptar las
modalidades o categorías: Excelente, bueno, regular y deficiente. También son
ejemplos de variables cualitativas: Genero: masculino y femenino; calidad de
producto: excelente, bueno, malo; actividades preferidas: Lectura, Tv, cine, futbol,
etcétera. Con sus valores, que son cualidades, no se pueden realizar operaciones
aritméticas.
Variable cuantitativa, es la característica cuyos valores al ser medidos pueden
expresarse numéricamente y en diversos grados. Por ejemplo, temperatura, el
promedio ponderado, número de hijos, edad, ingresos mensuales, los gastos por
consumo de electricidad de las I.E, el número de alumnos por I.E, tiempo de vida
útil, etc. Con sus valores, que son números, se pueden realizar operaciones
aritméticas.
Las variables cuantitativas, a su vez, se subdividen en: discretas, y continuas.
b) Según su papel en la pregunta de investigación.
Podemos diferenciar las variables en función del papel que desempeñen en nuestra
pregunta de investigación. Si estudiamos la asociación entre dos variables las
denominaremos como dependiente e independiente, respectivamente. La que recibe
el nombre de dependiente (variable resultado o efecto) es aquella que pensamos
viene condicionada por la otra variable, que denominamos independiente (variable
explicativa o de exposición). Por ejemplo, si queremos estudiar la prevalencia de
diabetes en una muestra de población y conocer las variaciones según la edad y el
sexo de sus componentes, la presencia de diabetes sería la variable dependiente y la
edad y el sexo las independientes. Por el contrario, si estudiamos la influencia de la
diabetes sobre los niveles de presión arterial, esta sería la variable dependiente y la
diabetes se consideraría variable independiente.
Otros ejemplos:
- Si queremos estudiar la influencia de los estilos de aprendizaje en el desempeño
académico de los estudiantes de secundaria de cierta I.E, el desempeño a
académico seria la variable dependiente y los estilos de aprendizajes como la
variable independiente.
- Si se quiere determinar si la agresividad influye de manera significa en la
convivencia de los estudiantes de tercero y cuarto grados de primeria de cierta I.E.
Aquí la variable independientes: es la Agresividad y la variable dependiente: la
convivencia
c) Según el número de valores posibles de su espacio muestral.
Variable discreta o discontinuas, es aquella variable cuantitativa que puede tomar
sólo un determinado número de valores y no admite ningún valor entre dos valores
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 12
consecutivos fijos (es decir, que esta variable no puede tener fracciones). La variable
discreta representa valores enteros. Generalmente, es una variable cuyos valores se
obtienen por conteo (números naturales).
Por ejemplo, una familia puede tener 0, 1, 2,...hijos, pero no algún valor intermedio.
Otros ejemplos: Sea X el número de estudiantes de una clase. Es una variable
discreta ya que solo tomará los valores 1, 2, 3, 4... . Aquí no se admite hablar de 1 /2
o 1/4 o 1.5 de estudiante.
Las unidades de un artículo en inventario, el número de estudiantes por colegio, el
número de carpetas que se han encontrado defectuosos en una I.E., etc. Son también
ejemplos de variable discreta.
Variable continua, es aquella variable cuantitativa que puede tomar cualquier valor
numérico y que puede cambiar en cualquier cantidad. Ejemplos: el salario de un
profesor, el peso de los alumnos de educación inicial, el tiempo empleado para
realizar un trabajo, las calificaciones obtenidas en la primera evaluación de la
asignatura de Estadística, el número promedio de alumnos por I.E en una ciudad,
estatura, volumen, longitud, etc.
Puede verse intuitivamente que cuando se toma dos valores posibles cualquiera por
más cercanos que estos sean, supongamos 1.56 y 1.57, se aprecia que entre ambos
siempre hay valores posibles de diferencia. Puede ser 1.561; 1.562; 1.563; etcétera.
Entonces la cuestión es que no hallamos ruptura, sino una continuidad.
No obstante en muchos casos el tratamiento estadístico hace que las variables
discretas las trabajemos como si fuesen continuas y viceversa.
Hay que señalar que, en general, cualquier carácter de tipo cuantitativo se puede
ofrecer en términos cualitativos. Así, si el número de alumnos lo agrupamos en
intervalos se podría hablar de I.E pequeñas, medianas y grandes, siendo ahora el
carácter “tamaño de la I.E” de naturaleza cualitativa.
Las variables discretas pueden medirse en cualquier escala, aunque habitualmente se
medirán en escalas nominales u ordinales, mientras que las variables continuas solo
pueden medirse en escalas de intervalos y de razones.
d) Según escalas de medición de variables.
La medición puede definirse como el proceso de asignar, según reglas bien
definidas, números a las unidades estadísticas para una variable definida.
Una escala de medición es el conjunto de los posibles valores que una
cierta variable puede tomar. El nivel o escala en que una variable puede ser medida
determina las propiedades de medición de una variable, el tipo de operaciones
matemáticas que puede usarse apropiadamente con dicho nivel, las fórmulas y
procedimientos estadísticos que se utilizan para el análisis de datos y la prueba de
hipótesis teóricas.
Las escalas o niveles de medición se utilizan para medir variables o atributos. Se
distinguen cuatro tipos de escalas o niveles para la medición de las variables:
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 13
Nominal.
Ordinal.
De intervalos.
De razón o cociente o proporción.
Las dos primeras (nominal y ordinal) se conocen como escalas categóricas, y las dos
últimas (intervalo y razón) como escalas numéricas. Las escalas categóricas se usan
comúnmente para variables cualitativas, mientras que las numéricas son adecuadas
para la medición de variables cuantitativas.
Escala de Medición Nominal.
En una escala nominal se clasifica a las unidades de estudio (objetos, personas, etc.)
en categorías, basándose en una o más características, atributos o propiedades
distintivas y observadas, dándole a cada categoría un nombre (de ahí lo de
“nominales”). Los nombres que se emplean en la aplicación de la escala nominal de
medida no necesitan ser nombres (alfabéticos o alfanuméricos) en el sentido estricto
de la palabra. También se pueden utilizar números o numerales. Con las escalas
nominales (categóricas), los números asignados definen cada grupo distinto y sirven
meramente como etiquetas o identificadores.
La escala nominal es de naturaleza cualitativa, los números utilizados hacen
distinciones categóricas más que cuantitativas; cumplen una función puramente de
clasificación y no se pueden manipular aritméticamente; cada cifra representa una
categoría diferente. Por ejemplo, no tendría sentido en este nivel de medición,
calcular el promedio aritmético de diez códigos estudiantiles.
La magnitud de los números no refleja orden (ascendente o descendente) o jerarquía
(mayor o menor) de alguna de las cosas a las que fueron asignados, más bien sólo
sirven como códigos de identidad. Las observaciones no pueden ser ordenadas de
menor a mayor o de pequeño a grande, es decir, ninguna de las categorías tiene
mayor jerarquía que la otra, únicamente están reflejando diferencias en la variable.
La única cuestión comparativa relevante para los datos nominales pertenece a si dos
observaciones son o no la misma.
En esta escala se tienen dos o más categorías del ítem o variable medida. Las
variables nominales que incluyen dos categorías se denominan dicotómicas, como
por ejemplo, el sexo (masculino o femenino), el tipo de escuela a la que se asiste
(pública o privada) y el estado de salud de una persona (sano o enfermo). En una
encuesta ordinaria, una variable de este tipo permite las respuestas “Si” o “No”; en
una investigación de laboratorio, corresponderá a aquella que distingue la presencia
(el grupo experimental) o la ausencia (el grupo de control) de una manifestación
física del experimento.
Para el caso de la variable “sexo” sabemos que ésta tiene sólo dos categorías:
masculino y femenino.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 14
Si les asignamos una etiqueta o símbolo a cada categoría, esto identifica
exclusivamente a la categoría. Por ejemplo:
Si usamos numerales, es lo mismo. Aquí la elección de los números es arbitraria:
Las variables con tres o más categorías se denominan multicotómicas o
politómicas. Son ejemplos de estas variables las siguientes: filiación política, carrera
elegida, raza, canal de televisión preferido, ocupación, etc.
La filiación política es una variable nominal categórica. Si pretendiéramos operarla
aritméticamente tendríamos situaciones tan ilógicas como ésta:
Sean:
1 = liberal
2 = conservador
3 = independiente
4 = socialista
5 = otros
entonces,
1+2=3 liberal + conservador = independiente.
¿Tiene sentido una afirmación como la anterior?
Las únicas relaciones matemáticas adecuadas a las escalas nominales son las de
equivalencia (=) o no equivalencia (≠). Así, una unidad estadística (personas u
objeto) particular posee la característica que define la clase (=) o no la tiene (≠). Las
escalas nominales sólo admiten el cálculo de proporciones y porcentajes.
En el ejemplo de la variable sexo: Sólo se puede decir que el símbolo 1 es distinto al
símbolo 2, pero no podemos decir que 2 es mayor que 1, o que 1 es menor que 2.
Con los datos obtenidos con este tipo de escalas, permitirán básicamente obtener el
número o porcentaje de sucesos en cada categoría (o modalidad) de la variable
estudiada y obtener la moda (valor de mayor frecuencia).
Ejemplos de variables que deben ser medidas en escalas nominales son:
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 15
. Clasificaciones de los estudiantes por carreras (Administración – 1; Educación –
2; Derecho – 3; Estadística – 4; etc.).
. Uso de anteojos (normales, bifocales, lentes de contacto, etc.).
. Número de camiseta de los jugadores en un equipo de fútbol (1, 2, 3, … , 20).
. Código de identificación de un estudiante o un funcionario en su carné.
. Color de los ojos (negros, pardos, azules, verde, etc.).
. Cereales cultivados en una región: trigo, maíz, centeno, soya, etc.
. Nacionalidad (peruano, colombiano, ruso, italiano, senegalés, etc.).
. Sabor favorito de helado (vainilla, chocolate, fresa, etc.).
. Número del carnet universitario.
. Estrato (1, 2, 3, 4, 5, 6).
Una representación gráfica de una escala nominal se presenta en la figura 1.7
Figura 1.7. Escalas nominales para la variable “estado civil”
Nótese que el orden de los identificadores (casado, soltero, etc.) puede cambiar y la
escala sigue siendo la misma y puede aplicarse de igual forma.
Escala de Medición Ordinal.
Una escala de medición ordinal es una escala nominal donde las observaciones
pueden colocarse en un orden relativo con respecto a la característica que se evalúa,
es decir, las categorías de la variable están clasificadas u ordenadas por rango de
acuerdo con la característica especial que poseen. Cada categoría posee una misma
relación posicional con la siguiente; es decir, la escala muestra situaciones
escalonadas.
Aquí, las etiquetas o símbolos de las categorías si indican jerarquía. Si utilizamos
números, la magnitud de estos no es arbitraria sino que representa el orden del rango
del atributo observado. Sólo las relaciones “mayor que”, “menor que” e “igual a”
tienen significado en una escala de medición ordinal.
Cuando los objetos se clasifican por una característica, es posible determinar qué
objeto tiene más o menos de la característica comparada con otro; pero no podemos
decir, basados en el orden solamente, en cuánto difieren. Consideremos, por ejemplo,
tres objetos que se ha ordenado como primero, segundo y tercero, teniendo en cuenta
alguna característica. La cantidad en que el objeto colocado en segundo lugar se
diferencia del primero, no es necesariamente igual a la cantidad en que difiere del
objeto clasificado en tercer lugar.
En este tipo de escalas, los datos son mutuamente excluyentes (un individuo, objeto o
medición pertenece únicamente a una categoría), y exhaustiva (cada individuo,
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 16
objeto o medición, debe pertenecer, obligatoriamente, a una cualquiera de las
categorías).
Para mayor claridad tomemos como referencia la clasificación de los cargos en una
determinada empresa como se muestra a continuación:
Cargo Código
Presidente 10
Vicepresidente 9
Director General 8
Gerente de área 7
Subgerente 6
Jefe de sección 5
Empleado A 4
Empleado B 3
Empleado C 2
Intendencia 1
Sabemos que el presidente (10) es más que el Vicepresidente (9), éste más que el
Director General (8), a su vez este último más que el Gerente de área (7) y así
sucesivamente; pero no puede precisarse en cada caso cuánto más. Tampoco
podemos realizar operaciones aritméticas básicas; no podríamos decir que 4
(empleado A) + 5 (jefe de sección) = 9 (vicepresidente); ni que 10 (presidente) + 5
(jefe de sección) = 2 (empleado C). Sería absurdo, no tiene sentido.
No importa qué se asigne en el ejemplo anterior, al cargo más alto el rango numérico
más alto o el más bajo, siempre que seamos consecuentes al dar a las entidades su
posición relativa adecuada a la serie ordenada. Sin embargo, se ha generalizado la
costumbre de asignar los rangos numéricos más bajos (1°, 2°, 3°, etc.) a los más altos
en la escala. Así, el ganador de una competencia recibe el rango de “primero”, el
siguiente orden “segundo”, y así sucesivamente.
En términos generales, se miden en una escala ordinal, la mayor parte de los
atributos de los objetos o personas, tales como el sabor, la belleza, la honestidad, la
calidad de un servicio, etc.
Las encuestas de opinión con frecuencia utilizan una medida en escala ordinal como
“totalmente de acuerdo”, “de acuerdo”, “sin opinión”, “en desacuerdo”, y “en total
desacuerdo”.
En las encuestas de opinión hubiera podido utilizar los rangos de “1”, “2” “3”, “4” y
“5” o “-2”, “-1”, “0”, “1” y “2” para este asunto.
Las diferencias aritméticas entre los valores carecen de sentido. Un producto con
rango “2” no es dos veces mejor que uno con rango “1”.
En las escalas ordinales sólo son válidas las relaciones de igualdad (), de no
igualdad (≠) y de orden (). Desde el punto de vista matemático, y al igual que las
escalas nominales, las escalas ordinales sólo admiten el cálculo de proporciones y
porcentajes.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 17
El método estadístico con datos obtenidos en escala ordinal consiste básicamente en
obtener el número o porcentaje de casos en cada modalidad y obtener la moda, la
mediana, los percentiles y el coeficiente de correlación por rangos.
Daremos algunos ejemplos de variables que pueden ser medidas o representadas en
escalas ordinales:
. Notas escolares cualitativas (P – proceso; L – logrado; D – destacado).
. Asignación de un número a los pacientes de una consulta médica, según el orden
de llegada (al primero el Nº 1, al siguiente el Nº 2 y así sucesivamente).
. Grado de escolaridad (primaria, secundaria, técnico profesional, universitario,
etc.).
. Conformidad con una afirmación: 0) completo desacuerdo, 1) acuerdo parcial, 2)
acuerdo total.
. Fumar: 0) no fumador, 1) fumador leve, < 10/día, 3) fumador moderado, 10 –
20/día, y 3) gran fumador, > 20/día.
. Calificación obtenida al concluir un programa de capacitación en cómputo:
4) excelente, 3) bueno, 2) aceptable, 1) deficiente.
. Clasificación de películas por una comisión especializada (menores de 12 años –
1; mayores de 12 años en compañía de adultos – 2; mayores de 18 años – 3;
categoría Triple X – 4).
. Posición de un candidato político según su grado de popularidad.
. Clasificación de los libros por año de edición.
. Días de la semana.
. Meses del año.
Escala de Medición de Intervalos
Una escala de intervalos es una escala ordinal con cuyos "valores numéricos" no sólo
se pueden verificar igualdad, no igualdad y orden, si no también, se puede elegir una
unidad de escala y comprobar cuántas veces la diferencia entre dos valores es igual
a la diferencia entre otros dos valores de la escala (es decir, podemos comparar
intervalos).
La escala de intervalos tiene un “cero relativo”. Este cero no significa ausencia
total de la propiedad que se observa.
En las escalas de intervalos, además del orden o jerarquía entre categorías, las
etiquetas o números consecutivos establecen intervalos iguales en la medición (las
distancias entre categorías son las mismas a lo largo de toda la escala). La medición
en una escala de intervalos se basa en suponer que puede conocerse exactamente la
diferencia entre los objetos medidos según esta escala. Es decir, debe ser posible
asignar un número a cada objeto de modo tal que la diferencia entre los objetos
quede reflejada por la diferencia entre los números asignados. Por ejemplo, la
diferencia entre los valores 4 y 5 es la misma que entre los valores 1 y 2, o entre 9 y
10. Un cambio unitario en la escala reflejará siempre el mismo cambio en el objeto
medido.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 18
Figura 1.8. Formato de escala de intervalo
Las variables medidas en escalas de intervalo dan una idea de cuánto o de qué
tamaño es lo que se está midiendo. Por ejemplo, qué tan cálido o frio es, qué tan
cerca o lejos está, qué tan triste o alegre se siente, qué tan pesado o liviano es.
En este tipo de escala de medida que es una escala de medición cuantitativa, puede
utilizarse cualquier unidad, sea cual sea su magnitud; y la elección del cero (origen)
puede hacerse de modo arbitrario. El cero no representa conceptos como “ninguno”,
“vacío” o “nada”; es decir, cero no representa la ausencia de la característica medida;
representa un punto conveniente del cual se marcan intervalos de igual magnitud
para construir la escala. Este punto podría colocarse en cualquier posición dentro del
rango posible de la variable que se mide.
La medición de la temperatura en una escala de grados Centígrados o Fahrenheit
constituye una medición por intervalos típica. La elección de origen (cero) es
arbitraria, no implica que realmente haya cero (ninguna) temperatura (incluso en
ambas escalas el cero es diferente). Por ejemplo, la diferencia entre las temperaturas
de 50° y 51° es idéntica en magnitud a la diferencia entre 70° y 71°. Para la escala
centígrada de temperatura, la temperatura a la cual el agua se congela se asigna a
0°C; para la escala Fahrenheit, el agua se congela a 32°F, el punto en el que una
solución salina saturada se congela se asigna a 0°F.
Si la temperatura de ayer fue de 17°C y la de hoy es de 20°C, podemos decir no
solamente que la temperatura de hoy supera la de ayer, sino también que la diferencia
entre ellas es 3°C.
Sin embargo, la razón entre los números de la escala no es necesariamente la misma
que la existente entre las cantidades del atributo. Ejemplo: una habitación a 20
grados no está el doble caliente que otra a 10 grados. Ello se debe a que el cero de la
escala no expresa el valor nulo o ausencia del atributo.
Con los valores de esta escala son válidas las relaciones de igualdad, de no igualdad
y de orden, las operaciones de adición y sustracción entre los valores de la escala, y
la multiplicación y división entre las diferencias de dos valores de la escala. Pero, no
es válida la multiplicación y división entre los valores mismos de la escala.
Por ejemplo, si la variable X es "puntaje" obtenido en una práctica calificada de 2 a
20 donde la unidad de medida es un punto a partir de 2 (cero relativo), entonces, se
tiene una escala de intervalos. En efecto, si tres alumnos A, B, y C han obtenido los
puntajes: 2, 4 y 16 respectivamente, no solo se verifican las relaciones 2 4 16 y 2
4 16, si no también: 1627(42); es decir la diferencia de los puntajes de C
menos A es igual a siete veces la diferencia de los puntajes de B menos A. No es
válida la división 16/4, pero si lo es, (162)/(42).
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 19
Las escalas de intervalo, además, permite estimar estadísticas como: la media
aritmética, mediana, moda, rangos y desviación estándar.
Algunos ejemplos de este tipo de escala y variables medidas en ellas son:
. Lapsos de tiempo transcurridos entre 2011-2015 y 2016-2020.
. Escalas de los test psicológicos.
. Temperatura del cuerpo humano.
. Ubicación de una carretera respecto de un punto de referencia (Km 85, Ruta 5).
. Nivel de aceite en el motor de un automóvil medido con una vara graduada.
. Variables usadas en test de rendimiento
. Temperatura corporal.
. Puntaje obtenido por un equipo en un campeonato deportivo.
. Sobrepeso respecto de un patrón de comparación.
A diferencia de las variables de intervalo, las variables ordinales son adimensionales
aun cuando las categorías ordenadas estén numeradas. Por ejemplo, al terminar una
carrera de autos fórmula 1, la ubicación de los competidores (1, 2, 3, etc.) es sólo
ordinal puesto que los números indican simplemente qué autos cruzaron la línea de
meta en primero, segundo, tercer lugar, y así sucesivamente; pero no nos clarifican
qué tan cerca o alejados llegaron los unos de los otros. Para considerar esta variable
ordinal como una de intervalo, los autos deberían haber llegado al mismo tiempo, en
un solo orden y a distancias iguales entre ellos. Por ejemplo, el auto ganador debió
haberle tomado una diferencia de 20 metros al segundo; este una de 20 metros al
tercero; a su vez el tercero, haber llegado a la meta a una distancia de 20 metros del
cuarto y así sucesivamente.
La resta entre los números que identifican la posición de una variable ordinal en la
escala correspondiente proporciona sólo diferencias entre rangos y no la distancia
entre puntuaciones. Por ejemplo, si tomamos el auto que llegó en cuarto lugar
(Renault) con relación al que llegó en noveno lugar (Ferrari), la diferencia (9 – 4 = 5)
entre sus posiciones indica, únicamente, que el auto de Renault llegó cinco puestos
adelante del auto de la Ferrari. Estos pudieron haber llegado a la meta, separados
unas decenas de metros o a dos vueltas de distancia.
Como se ha podido observar, las variables ordinales permiten ciertos cálculos como
diferencias en rango y rango promedio, pero tienen la utilidad matemática limitada.
De otra parte, las variables de intervalo permiten la realización de varias operaciones
aritméticas y garantizan la utilidad matemática mayor.
Escala de Medición de Razón o Cociente
La escala de razón llamada también de cocientes, tienen las propiedades de las
ordinales y de intervalo (intervalos iguales entre categorías y aplicación de las
operaciones aritméticas básicas y sus derivaciones), pero además, el cero es real, es
absoluto, no es arbitrario. Es decir, el cero representa ausencia total de la
propiedad que se observa; en consecuencia, los números pueden compararse como
proporciones y nos permite indicar cuántas veces es más grande un objeto que otro,
además de señalar la cantidad en que difieren. Por ejemplo, si la variable son los
gastos en transporte de un trabajador en una determinada semana y nos dice que no
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 20
tuvo gastos durante esa semana, entonces es válido decir que dichos gastos fueron
iguales a cero. De igual manera podemos valorar la antigüedad de una persona en
una empresa que apenas ingresa a laborar. En este caso diríamos que la antigüedad
de esa persona es de cero años o meses.
En esta escala sólo es arbitraria la unidad de medida. El hecho de fijar el origen
permite hacer comparaciones no sólo de los intervalos de los objetos, sino también
de los valores de los números asignados a estos objetos. Es así que en este tipo de
escala tiene sentido las “razones”, y puede decirse, por ejemplo, que “el valor x es el
doble que el de y”. El peso, la longitud y la masa se miden en una escala de razones.
Las distancias expresadas en kilómetros, millas o pies son ejemplos de mediciones en
una escala de razones, ya que en todos estos casos las escalas tienen un origen
común. En la medición del valor de las cosas o de los ingresos también se emplea
una escala de razones. Ya sea que la unidad empleada sea el peso, el dólar o el sol, la
ganancia cero es siempre la misma.
Figura 1.9. Formato de escala de razón
Las medidas de longitud para las cuales se utiliza una regla o una cinta métrica
ejemplifican una medición de proporción. Si Ricardo mide 1.70 metros de altura y
Romel 1.60 metros, entonces Ricardo es 106% (1.70 /1.60 = 1.06) tan alto como
Romel o Ricardo es 6% (1.70 /1.60 - 1= 0.06) más alto que Romel. La evaluación de
CI, sin embargo, no tiene la cualidad de proporción si María tiene un CI de 125 y
Aura tiene un CI de 100, no se puede decir que María es 25% más inteligente que
Aura.
Es importante indicar el nivel de medición de todas las variables e ítems de la
investigación, porque dependiendo de dicho nivel se selecciona uno u otro tipo de
análisis estadístico. Por ejemplo, la prueba estadística para correlacionar dos
variables de intervalo es muy distinta a la prueba para correlacionar dos variables
ordinales. Así, es necesario hacer una relación de variables, ítems y niveles de
medición.
Desde el punto de vista matemático, las escalas de razón admiten el cálculo de todo
tipo de operaciones aritméticas, obtener razones y proporciones, así como la
estimación de un buen número de estimadores estadísticos. La economía y la
Demografía son las áreas que más utilizan este tipo de escalas.
Algunos ejemplos de variables medidas en este tipo de escala son:
. Número de hijos en una familia.
. Litros de agua consumidos por persona al día.
. Velocidad de un auto de carreras.
. Tiempo de permanencia frente a una computadora.
. Concentración de glucosa en una muestra: medida en mg7dl.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 21
. Número de goles marcados por un futbolista en un partido.
. Ventas de un producto
. Ingreso familiar mensual.
. Peso (quilates) de una joya de oro.
. Tiempo de vuelo.
. Ventas de un producto
. Tasa de mortalidad: muertes por 1000 personas en riesgo.
Las variables continuas van a medirse con escalas de razones o intervalos, por lo que
es habitual que nos refiramos a ellas englobándolas como escalas continuas, ya que
comparten estrategias de análisis de análisis, como la elección del test estadístico.
En la tabla 1.2, presentamos un resumen de las características de las diferentes
escalas de medida.
Tabla 1.2. Características de las diferentes escalas de medida de variables.
Tipo de Operatividad Requisito
escala
Las categorías de los datos son mutuamente
Nominal Igualdad / desigualdad excluyentes, es decir, un objeto o individuo debe
pertenecer a una de las categorías.
Las categorías de datos están clasificas u
Ordinal Jerarquía mayor / menor ordenadas de acuerdo con la característica especial
que poseen.
Las categorías están ordenadas de acuerdo con la
cantidad de características que posean.
Diferencias iguales en la característica están
De Comparación de representas por diferencias iguales en los números
intervalos intervalos asignados a las categorías.
El punto cero (cero absoluto) refleja la ausencia de
De razones Comparación continua esta característica.
Nota. Uno de los puntos más importantes de una investigación es determinar el tipo
de análisis estadístico de los datos que se va a llevar a cabo. En estadística el tipo de
análisis depende del nivel o escala de medición de las variables de investigación.
Cada nivel requiere un análisis diferente. La importancia de esta clasificación por
niveles reside en que mientras más complejo a alto es el nivel de medición, más
efectivos son los métodos estadísticos que se pueden utilizar.
Vale la pena destacar que las cuatro escalas de medida incrementan en complejidad,
progresando desde la medida en escala nominal rudimentaria, a una medida en escala
de razón más refinada. Cada medida ofrece más información sobre la variable que la
anterior. Esta distinción entre los diversos grados de refinamiento es importante,
debido a que las diferentes técnicas estadísticas requieren de distintas escalas de
medida. A pesar de que la mayoría de las pruebas estadísticas requieren medidas en
escala de intervalo o de razón, otras pruebas denominadas pruebas no paramétricas
(que se analizara más tarde en esta asignatura), están diseñadas para utilizar datos
ordinales o nominales.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 22
1.5.1.1. Tipo de variable según su grado de complejidad.
Según el grado de complejidad, tanto las variables cuantitativas como las
cualitativas pueden ser simples o compuestas (complejas).
a) Las variables simples son las que se manifiestan directamente a través de un
indicador o unidad de medida. No se descomponen en dimensiones.
Ejemplos: el precio de un producto, que se expresa en unidades monetarias y la edad
que se manifiesta en años cumplidos.
b) Las variables compuestas son aquellas que se pueden descomponer en dos
dimensiones como mínimo.
Por ejemplo: La variable calidad de servicio que presenta el Hotel Paraíso, es una
variable que no nos da un valor a observar de forma directa. En este caso esta
variable debemos descomponer en tres dimensiones: Calidad del servicio en la
Recepción, calidad de servicio en las habitaciones y calidad del servicio en el
restaurante.
Qué es dimensión? Una dimensión es un elemento integrante de una variable
compuesta o compleja, que resulta de su análisis y descomposición.
1.5.2. Escala de Likert.
La escala de Likert es un método de investigación de campo que permite medir la
opinión de un individuo sobre un tema a través de un cuestionario que identifica el
nivel de acuerdo o desacuerdo con una declaración (enunciado, pregunta,
afirmaciones, ítem, elemento o también reactivo).
La escala de Likert que es una variante de la escala ordinal, es una escala
psicométrica comúnmente utilizada en cuestionarios y es ideal para medir reacciones,
actitudes y comportamiento de una persona. Se le da este nombre por el
psicólogo Rensis Likert quien publicó en 1932 un informe donde describía su uso.
Likert distinguió entre una escala apropiada, la cual emerge de las respuestas
colectivas a un grupo de ítems (pueden ser 8 o más), y el formato en el cual las
respuestas son puntuadas en un rango de valores. Técnicamente, una escala de Likert
hace referencia a último.
En una encuesta con preguntas de escala Likert los encuestados no eligen entre “si/
no”, sino que les permite calificar sus respuestas a una determinada declaración de la
encuesta.
La escala de Likert es uno de los tipos de escalas de medición utilizados
principalmente en la investigación de mercados para la comprensión de las opiniones
y actitudes de un consumidor hacia una marca, producto o mercado meta.
Hay que hacer una distinción importante entre escala de tipo Likert y elemento de
tipo Likert. La escala es la suma de las respuestas de los elementos del cuestionario.
Los elementos de tipo Likert van acompañados por una escala visual análoga (por
ejemplo, una línea horizontal, en la que el sujeto indica su respuesta eligiéndola con
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 23
un círculo); a veces se llama escalas a los elementos mismos. Esta es la razón de
muchas confusiones y es preferible, por tanto, reservar el nombre de escala de tipo
Likert para aplicarlo a la suma de toda la escala, y elemento de tipo Likert para
referirse a cada elemento individualmente.
Un elemento de tipo Likert es una declaración que se le hace a los sujetos para que
éstos lo evalúen en función de su criterio subjetivo (generalmente se pide a los
sujetos que manifiesten su grado de acuerdo o desacuerdo). Es recomendable que la
declaración o enunciado no excedan de 20 palabras.
Las respuestas pueden ser ofrecidas en diferentes niveles de medición, permitiendo
escalas de 5, 7 y 9 valores configurados previamente. Las declaraciones o enunciados
deben tener siempre dos posturas extremas así como una postura intermedia (o
neutral) que sirva de graduación entre los extremos.
El formato de un típico elemento de Likert con 5 valores de respuesta sería:
(+) Positivo
Ni
Totalmente De de acuerdo En Totalmente
de acuerdo ni en desacuerdo en
acuerdo desacuerdo desacuerdo
(- ) Negativo
Agregar la palabra “algo” a ambos lados crea el sexto y séptimo valor.
(+) Positivo
Ni
Totalmente De Algo de acuerdo Algo En Totalmente
de acuerdo de ni en en desacuerdo en
acuerdo acuerdo desacuerdo desacuerdo desacuerdo
(- ) Negativo
1.5.2.1. Dirección de las afirmaciones.
La declaración o ítems por lo general tienen implícita una dirección positiva o
negativa. La codificación o puntuación de las alternativas de respuestas, se asigna de
acuerdo a la dirección del ítem.
Por ejemplo la declaración:
El servicio de alojamiento que recibí fue justo, en relación al precio pagado.
Manifiesta una dirección positiva y además esta declaración incluye 13 palabras. En
este caso, la puntuación para las alternativas de respuesta es:
(5) Totalmente de acuerdo (+2) Totalmente de acuerdo
(4) Moderadamente de acuerdo (+1) Moderadamente de acuerdo
(3) Ni en acuerdo ni en desacuerdo (0) Ni en acuerdo ni en desacuerdo
(2) Moderadamente en desacuerdo (-1) Moderadamente en desacuerdo
(1) Totalmente en desacuerdo (-2) Totalmente en desacuerdo
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 24
En este ejemplo, cuanto más de acuerdo con la declaración estén los participantes, su
actitud será igualmente más favorable o positiva.
En cambio sí se expresará en la forma:
El servicio de alojamiento que recibí no fue justo, en relación al precio pagado.
La declaración o ítem tiene una dirección negativa y además incluye 14 palabras. En
este caso, la puntuación se invierte.
(1) Totalmente de acuerdo (-2) Totalmente de acuerdo
(2) De acuerdo (-1) Moderadamente de acuerdo
(3) Ni en acuerdo ni en desacuerdo (0) Ni en acuerdo ni en desacuerdo
(4) Moderadamente en desacuerdo (+1) Moderadamente en desacuerdo
(5) Totalmente en desacuerdo (+2) Totalmente en desacuerdo
En este ejemplo, cuando más de acuerdo estén los participantes con la declaración,
implica que su actitud es menos favorable, esto es, más desfavorable o negativo.
A continuación se presentan ejemplos de declaraciones que manifiestan una
dirección positiva y otros que manifiestan una dirección negativa.
Entiendo de manera clara las metas de la empresa:
5 4 3 2 1
Siempre Casi siempre Algunas Muy pocas Nunca
veces veces
Algunas tareas a diario asignadas tienen poca relación con las metas:
1 2 3 4 5
Siempre Casi siempre Algunas Muy pocas Nunca
veces veces
La cantidad de enunciados o ítems que integran una escala Likert varía de acuerdo a
la naturaleza de la variable operacionalizada.
1.5.2.2. Los pasos a seguir para la construcción de la escala son:
Los pasos a seguir en la elaboración de la escala son los siguientes:
1) Definir la variable a medir.
2) Operacionalización de la variable, es decir, se determina como se habrá de medir
y se señalan los indicadores.
3) Diseño de una cantidad suficiente de ítems favorables y desfavorables a la
variable que se pretende medir. Algunos autores sugieren elaborar alrededor de
50 ítems, balanceando la escala con igual cantidad de enunciados favorables y
desfavorables.
4) Asignar los puntajes a los enunciados o ítems según su dirección positiva o
negativa.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 25
5) Depuración de la escala (se puede realizar mediantes sesiones de lluvias de ideas,
grupos focales o una revisión de la literatura existente) con el propósito de
seleccionar los ítems que habrán de integrarse a la versión final de la escala.
6) Efectuar el análisis de ítems (validación, aplicación de una muestra piloto y
confiabilidad).
7) Administrar la versión final de la escala a las personas que integran la muestra de
estudio.
8) Obtención de la puntuación total de cada persona que integra la muestra de
acuerdo al tipo de respuesta en cada ítem, reflejando la actitud global hacia la
variable medida.
1.5.2.3. Otras consideraciones sobre esta escala son:
A veces se disminuye o se incrementa el número de alternativas de respuestas,
sobre todo cuando los respondientes potenciales pueden tener una capacidad muy
limitada de discriminación o por el contrario, muy amplia. Si los encuestados
tienen poca capacidad de discriminar pueden incluirse dos o tres alternativas de
respuestas. Por el contrario, si son personas con un nivel educativo elevado y
capacidad de discriminación, pueden incluirse siete o más alternativas de
respuestas. Pero debe recalcarse que el número de alternativa de respuesta debe
ser el mismo para todo los ítems, si son tres, son tres alternativas para todo los
ítems o declaraciones. Sin son cinco, son cinco alternativas para todos los ítems.
En ocasiones se elimina la opción o categoría intermedia y neutral (ni de acuerdo
ni en desacuerdo, neutral, indeciso, …) para comprometer al sujeto o forzarlo a
que se pronuncie a manera favorable o desfavorable.
Ejemplos.
a) (1) De acuerdo (0) En desacuerdo
b) (3) De acuerdo (2) Ni de acuerdo ni en desacuerdo (1) En desacuerdo
c) (7) Totalmente de acuerdo (6) De acuerdo (5) Indeciso, pero más bien de acuerdo
(4) Indeciso, ni de acuerdo ni en desacuerdo (3) Indeciso, pero más bien en desacuerdo
(2) En desacuerdo (1) Totalmente en desacuerdo
Al construir una escala Likert, debemos asegurar que las declaraciones y
alternativas de respuesta sean comprendidas por los sujetos a los que se les
aplicará y que estos tendrán la capacidad de discriminación requerida. Ello se
evalúa cuidadosamente en la prueba piloto.
Preguntas en lugar de declaraciones. En la actualidad, la escala original se ha
extendido a preguntas y observaciones. Por ejemplo:
¿Cómo considera usted al conductor que aparece en los programas?
(5) Muy buen conductor
(4) Buen conductor
(3) Regular
(2) Mal conductor
(1) Muy mal conductor
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 26
Cabe mencionar que pueden existir tantos tipos de encuestas para escalas de
Likert como se deseen, todo depende del campo de investigación , siendo la
escala de satisfacción del consumidor solo uno de ellos.
1.5.2.4. Ejemplos de respuestas en la escala de Likert
Ya que vimos algunos ejemplos de preguntas Likert que puedes implementar en tu
próxima encuesta, vamos a compartirte algunos tipos de respuesta que puedes ofrecer
al encuestado según el tipo de escala de Likert que utilices:
Acuerdo Frecuencia Importancia Probabilidad
-Totalmente de acuerdo - Muy frecuentemente - Muy importante - Casi siempre verdad
- De acuerdo - Frecuentemente - Importante - Usualmente verdad
- - Indeciso - - Ocasionalmente - Moderadamente - - Ocasionalmente verdad
- - En desacuerdo - - Raramente Importante - - Usualmente no verdad
- Totalmente en - - Nunca - - De poca importancia - Casi nunca verdad
desacuerdo - Sin importancia
1.5.3. La escala de satisfacción de Likert.
La escala de satisfacción de clientes de tipo likert es solo una de las
distintas escalas de likert que existen. Esta, en particular, busca medir el nivel
de conformidad que los consumidores tienen respecto a una serie de
afirmaciones o de preguntas formuladas, pudiendo el encuestado manifestar
qué tan de acuerdo se encuentra con dichas afirmaciones. Por tanto, dentro del
ámbito de satisfacción de clientes, las encuestas de likert pueden hacer
referencia a qué tan de acuerdo está el consumidor con una afirmación (con
dirección positiva o negativa) respecto a una experiencia, proceso, marca,
servicio, producto, entre otros.
¿Qué mide la escala de satisfacción de Likert?
La escala de satisfacción Likert permite evaluar las siguientes áreas:
Qué tan de acuerdo está el cliente con una afirmación.
La frecuencia con la que el cliente realiza una actividad.
La dificultad que tiene el cliente para realizar una actividad.
El grado de importancia que el cliente le atribuye a algo.
La probabilidad de que el cliente realice una acción a futuro.
La valoración por parte del cliente de un servicio, producto, etc.
Este último punto, sobre la valoración, es el que está más estrictamente
relacionado con la satisfacción. Sin embargo, las encuestas para escala de
Likert del resto de áreas también nos pueden dar una idea bastante precisa
sobre cuál es la satisfacción del cliente en función de qué tan seguido realiza
una actividad relacionada con la empresa, si tiene pensado hacerla a futuro,
qué tan importante es para él, etc.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 27
¿Cómo se mide la escala se satisfacción de Likert?
Muy satisfecho Satisfecho Neutral Insatisfecho Muy insatisfecho
La escala de satisfacción de Likert se obtiene mediante una encuesta con
distintas afirmaciones o preguntas, el cliente debe valorar cada ítem eligiendo
1 de 5 respuestas posibles, las cuales pueden variar en su formulación, pero
generalmente son las siguientes:
Totalmente de acuerdo.
De acuerdo.
Neutral.
En desacuerdo.
Totalmente en desacuerdo.
A cada posible respuesta se le debe asignar un valor numérico. Por ejemplo,
“totalmente de acuerdo = 5” y “totalmente en desacuerdo = 1”. Como ya se
mencionó, la sumatoria de los resultados es lo que se conoce puntualmente
como “escala de Likert”, mientras que cada afirmación o ítem se conoce
como “elemento de Likert”.
1.5.3.1. Ejemplos de afirmaciones o preguntas de escala de satisfacción de
Likert.
A continuación, presentamos algunos ejemplos de afirmaciones o preguntas para la
escala de satisfacción de Likert que puedes aplicar durante el proceso de
investigación.
1) Ejemplo de escala de Likert para el nivel de acuerdo o desacuerdo de una
declaración o un enunciado
Creo que la innovación es el elemento más importante a la hora de iniciar
una startup (puesta en marcha).
Totalmente en En desacuerdo Ni de acuerdo, ni De acuerdo Totalmente de
desacuerdo en desacuerdo acuerdo
1 2 3 4 5
2) Ejemplos de escala de Likert sobre la frecuencia de una actividad
Salgo de vacaciones al menos 2 veces al año.
Nunca Raramente Ocasionalmente Frecuentemente Muy
frecuentemente
1 2 3 4 5
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 28
Comprarás en la tienda Plaza vea al menos 2 veces a mes.
Totalmente en En desacuerdo Ni de acuerdo, ni De acuerdo Totalmente de
desacuerdo en desacuerdo acuerdo
1 2 3 4 5
3) Ejemplos de escala de Likert sobre el grado de importancia de un factor
La experiencia del usuario dentro de mi estrategia comercial es ….
Sin De poca Moderamente Importante Muy
importancia importancia importante
1 2 3 4 5
4) Ejemplos de escala de Likert para la valoración de una marca, empresa,
producto o servicio
La empresa agroindustrial A se preocupa por el medio ambiente y la naturaleza.
Totalmente en En desacuerdo Ni de acuerdo, ni De acuerdo Totalmente de
desacuerdo en desacuerdo acuerdo
1 2 3 4 5
¿Cómo valoras el servicio de atención al cliente recibido?
Muy malo Malo Indiferente Bueno Muy bueno
1 2 3 4 5
5) Ejemplo de escala de Likert sobre la probabilidad de realizar una acción a
futuro
Tengo planeado adquirir un automóvil en los próximos 6 meses.
Totalmente en En desacuerdo Ni de acuerdo, ni De acuerdo Totalmente de
desacuerdo en desacuerdo acuerdo
1 2 3 4 5
1.5.4. Escala de satisfacción CSAT (Customer Satisfaction Score)
La Customer satisfaction Score (CSAT), traducida al español como “Escala de
Satisfacción del Cliente”, es otra escala de satisfacción bastante popular, debido a
que está pensada al 100% para evaluar, precisamente, la satisfacción del consumidor
respecto a un proceso, servicio o producto.
Similar a la escala de Likert, la CSAT busca evaluar qué tan satisfecho o
insatisfecho se encuentra el cliente. La principal diferencia es que la encuesta
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 29
CSAT se basa en una única pregunta. También, se diferencia a la de Likert en
las distintas opciones de respuestas disponibles, así como en el método de
análisis de resultados para la obtención de la escala de satisfacción.
El CSAT es un indicador de satisfacción del cliente que se mide a través de
una encuesta realizada inmediatamente después de que termina la interacción
de dicho cliente con la empresa (posterior entrega del producto). De este
modo, la empresa puede conocer la percepción del cliente sobre su producto o
servicio. Al tratarse de una experiencia reciente, su opinión será descriptiva y
detallada, dejando abierta la posibilidad de identificar patrones de error en el
proceso.
¿Cómo se mide la escala de satisfacción CSAT?
La Escala de Satisfacción del Cliente se mide a través de una única pregunta
relacionada de forma directa con la satisfacción, sin contemplar otros campos
de investigación.
El CSAT funciona así: se realiza una encuesta al cliente vía telefónica, email
o SMS sobre la calidad del servicio. Este puede calificar en una escala de 1 a
5, donde 1 es "Nada satisfecho" 2 es “poco satisfecho”, 3 es “Normal”, 4 es
“Satisfecho” y 5 "Muy satisfecho".
Estas opciones de respuestas pueden presentarse de distintas maneras , ya sea
en forma de palabras, de números, de estrellas, de emoticonos (caras felices o
tristes) u otros elementos que hagan que la encuesta de satisfacción sea
atractiva y amigable.
Ejemplos de encuestas para escala de satisfacción CSAT
Algunos ejemplos de encuestas para la escala de satisfacción CSAT son los
siguientes:
1. ¿Cómo es tu nivel de satisfacción con el producto adquirido?
1. Muy satisfecho
2. Satisfecho
3. Normal
4. Poco satisfecho
5. Nada satisfecho
2. ¿Qué tan satisfecho te encuentras con el servicio de entregas?
1. Totalmente satisfecho
2. Muy Satisfecho
3. Satisfecho
4. Poco satisfecho
5. Nada satisfecho
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 30
Ejemplo del CSAT cómo índice de satisfacción del cliente en Beetrack.
Cuando una empresa logística utiliza Beetrack (software de optimización de
logística y transporte) para la monitorización de las entrega, al terminar cada
entrega el sistema le envía automáticamente al cliente una encuesta CSAT vía
email.
Esta encuesta consta de una única pregunta, la cual es “¿Cómo evaluaría su
satisfacción respecto al servicio entregado?”. Un ejemplo de cómo se ve la
pregunta CSAT y el método de respuesta es el siguiente :
¿Cómo evaluaría su satisfacción respecto al servicio entregado?
Una vez el cliente responde la pregunta y envía la evaluación general, es
redirigido a una sección donde puede entregar una evaluación detallada por
Envío, Servicio al Cliente y Producto. Aunque la encuesta CSAT tiene una
única pregunta, un método válido para sacarle el máximo provecho es
presentar varios ítems a evaluar dentro de la misma pregunta, cada uno
teniendo su respectiva escala de valoración.
Figura 1.10.
A través de estos distintos mecanismos que funcionan en conjunto, la empresa
puede obtener un índice de satisfacción de clientes con un alto nivel de
precisión y detalle. De esta manera logras determinar si estás entregando un
mal servicio al cliente o, por el contrario, uno muy bueno.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 31
Un producto que siempre presenta fallas, una baja calificación en el despacho
del mismo transportista, entre otros aspectos, te dan luces para realizar
mejoras concretas en tu gestión logística. Por esa razón, el sistema de
Beetrack te permite desplegar encuestas CSAT para conocer qué tan
satisfechos están tus clientes con sus pedidos recibidos o con la atención
prestada.
Figura 1.11. Vista de evaluación general de los usuarios en la plataforma.
Así, al conocer los niveles de satisfacción, se hará mucho más fácil diseñar
estrategias para mejorar los procesos de envío o establecer métodos dentro del
personal sobre cómo atender a un cliente de manera exitosa.
1.6. Concepto de Estadística.
Es frecuente que la Estadística se identifique con una tabla o colección de datos. De
hecho, eso es una estadística. Pero qué duda cabe que la Estadística no debe
entenderse como una mera colección de datos, aunque los mismos se presenten de
forma ordenada y sistemática.
La Estadística entendida como ciencia tiene un origen más reciente y el gran
desarrollo de la misma ha tenido lugar, fundamentalmente, a lo largo del siglo XX.
Hoy en día alcanza un alto desarrollo, con la ayuda de tantos investigadores
dedicados a perfeccionar métodos estadísticos modernos, que nos permiten
seleccionar aquellas técnicas más adecuadas para analizar una determinada cantidad
de información acelerando su proceso de cálculo con la ayuda de los programas de
computación (Software estadísticos), disminuyendo las probabilidades de error.
Como ciencia, la Estadística se puede definir como aquella que proporciona un
conjunto de métodos y técnicas que permite la obtención, organización, síntesis,
descripción e interpretación de los datos para la toma de decisiones en ambiente
de incertidumbre.
La metodología estadística adquiere entidad cuando de lo que se trata es de analizar
un elevado volumen de datos, pues por lo general, tras esa “masa de datos” se
esconden ciertas regularidades o leyes de comportamiento que nos permitirán, una
vez descritas, tomar decisiones en ambiente de incertidumbre, siempre que esta
pueda cuantificarse en términos de probabilidad, pues esas decisiones se basan en
una leyes que, a diferencia de las leyes de la física, no son exactas sino que están
sujetas a errores.
Dr. César Haro Díaz
Capítulo 1. La Estadística y su utilización en la investigación. 32
En el párrafo anterior han aparecido, no por casualidad, tres términos que nos van a
permitir desdoblar a la Estadística en dos ramas principales. Esos términos son:
describir, probabilidad y toma de decisiones con incertidumbre. El primero de
ellos da lugar a lo que se conoce como Estadística Descriptiva. La estadística
descriptiva o deductiva tiene como finalidad colocar en evidencia aspectos
característico que presenta una serie de datos sin pretender sacar conclusiones o a
generalizar con respecto a un grupo mayor. Esta rama es la más antigua de la
Estadística y su objeto es el análisis de los datos para descubrir o describir las
posibles regularidades que presenten.
Paralelamente, aunque con posterioridad, se desarrolló la Teoría de la
Probabilidad. La unión ambas ha dado lugar a lo que se conoce como Estadística
Matemática o Inferencia Estadística. El instrumental propio de esta rama
(Estadística inductiva o de inferencia) es el que nos permite tomar decisiones en
ambiente de incertidumbre. Se trata de decisiones basadas en la información que
suministran un grupo menor o muestra de datos y que permiten generalizar los
resultados obtenidos.
Uno de los principales objetivos de la estadística es hacer inferencias acerca de los
valores estadísticos de la población, denominados parámetros, a través de la
información obtenida en una muestra, que permite el cálculo de estimadores.
Dr. César Haro Díaz