¿Tienes confianza? La confiabilidad y el Alfa de Cronbach

Estimados todos, bienvenidos a un nuevo episodio de Stats SOS, espero que estén muy bien.

En la aventura de hoy tenemos que tener mucha confianza en nosotros y nuestros datos :). El post de hoy como bien sale, busca ver cuán confiables son nuestros datos. En otras palabras, ver si es que las personas nos han respondido por responder o si lo han hecho de manera consciente. Otro tema que nos ayuda la confiabilidad es conocer a grandes rasgos cómo es que está funcionando nuestro cuestionario.

En ese caso, el reto de nuestra aventura es poder resolver el tema de la confiabilidad y poder describirla de manera sencilla. 

Entonces, ¿qué es la confiabilidad? La confiabilidad estadística es cuando los resultados de un análisis se pueden reproducir en diferentes muestras. En otras palabras, son consistentes. Cuando se analiza un cuestionario, se busca que este tenga confiabilidad y consistencia interna. El primero significa que este cuestionario pueda representar efectivamente y sin un gran sesgo, las opiniones de las personas. Aparte, estas opiniones pueden reproducirse nuevamente con el mismo cuestionario.

¡Excelente! Ahora vamos a lo siguiente, consistencia interna. Como el mismo nombre lo dice, se refiere al interior de un cuestionario. En otras palabras, a que los puntajes de cada pregunta del cuestionario sean consistentes con el puntaje total de todo el cuestionario. Pero ahora me dirán, ¿Cómo diablos sacamos el puntaje total de todo la prueba? Muy sencillo, la colección de todas las preguntas del cuestionario nos permite obtener un puntaje total del mismo. Hay varias maneras de obtener esto, pero no tocaré este tema aquí, los que tienen interés en ello siempre pueden ir a la parte de comentarios :).

Entonces, dicho esto en esta aventura veremos específicamente una técnica para obtener la confiabilidad o fiabilidad que vendría a ser el análisis por consistencia interna, el cual es el Alfa de Cronbach. Pero es importante mencionar que existen otras formas de calcular la confiabilidad, como la técnica por mitades, el test-retest, etc.

Ojo, pestaña y ceja (1): El análisis de consistencia funciona de manera adecuada con preguntas que tienen un escala de respuesta de tipo Likert. Una escala Likert, es la clásica escala de respuesta que tiene por ejemplo, valores del 1 – 7, donde 1 es “Nunca”, 2 “Algunas veces”, hasta el  7 que sería “Siempre”. El Alfa de Cronbach no funciona bien con escalas que tienen valores sí y no (dos opciones de respuesta). Para ello, existen otras técnicas estadísticas (Sijtsma, 2009).

¡Perfecto! En lugar de estar hablando tanto, creo que lo mejor que podríamos hacer es ir a un ejemplo :). Imagínense que queremos conocer los niveles de estrés de un grupo de trabajadores justo después del cierre laboral de fin de mes donde la carga de trabajo es muy alta. Para ello, usamos un cuestionario de 33 preguntas sobre síntomas de estrés que tienen opciones de respuesta del 1-5, donde 1 es “Nunca” y 5 es “Siempre”.

Le pedimos a la empresa que nos de tiempo para entregarle una encuesta a los 250 trabajadores para conocer sus síntomas de estrés. Sin embargo, el encargado nos comenta que tengamos cuidado porque en este espacio laboral, la gente tiende a subestimar sus niveles de estrés y muchos de ellos no aceptan que se sienten muy tensos y evidencian síntomas de estrés.

Dicho esto, nos ponemos alerta y sabemos que tenemos que tener especial cuidado con esto. Muy bien, les tomamos el cuestionario de estrés a los trabajadores, ingresamos toda la información a la computadora y ¡a viajar!

Para nuestro viaje es necesario que sigamos la siguiente ruta:

Analizar/Escala/Análisis de fiabilidad/

En esta ventana, es necesario entrar a Estadísticos, y hacer click (pinchar) para marcar la casilla que dice “Escala si se elimina el elemento”, luego de ello Continuar. 

¡Genial! Ya estamos a mitad del proceso, ahora cerremos esta parte. Luego de ello, debemos poner los elementos que vendrían a ser todos los ítems o preguntas de la prueba que quieren analizar. Aceptar. 

¡Muy bien! Si necesitan un café, té o manzanilla, ¡este es el momento perfecto! (5 minutos después). (Tambores para darle ritmo a los análisis de nuestros resultados).

Tabla 1

Alfadecronbach

Esta primera tabla nos dice nuestro Alfa de Cronbach general. ¿Qué diablos significa este número? ¡Muy sencillo! En el fondo es una correlación, así como la correlación de Pearson que ya conocemos (ver post). La única diferencia con una correlación es que los valores posibles son de 0 – 1. Si les sale un Alfa de Cronbach negativo es muy probable que hay un error de dignación de los cuestionarios. 

En esencia, este estadístico nos propone lo siguiente: Nosotros le tomamos la prueba a 250 trabajadores, ¿cierto? Ahora asumamos que escogemos al azar otro grupo de 250 trabajadores y se les toma la misma prueba. Luego de ello, se hace una correlación de los puntajes de la prueba de nuestros trabajadores con este grupo “ficticio” o mejor dicho “esperado” de puntajes. Y así, mis valientes aventureros sale el Alfa de Cronbach. ¿Enredado? ¡No se preocupen! Lo seguimos viendo.

En ese caso, nuestro Alfa de Cronbach debe ser alto, porque demuestra que hay una relación fuerte entre estos dos grupos, lo cual a su vez muestra que hay consistencia, porque se puede reproducir los mismo puntajes de nuestra prueba de estrés con este otro grupo esperado.

En este caso, nuestro Alfa de Cronbach es de .933 lo cual muestra un Alfa de Cronbach bastante bueno. Algunos autores muestran que valores mayores a .70 son adecuados y que menor a esto puede ser complicado (George & Mallery, 2003; Gliem & Gliem, 2003). En ese caso, vamos !muy bien!

Tabla 2

descripcionconsistenciainterna1

 descripcionconsistenciainterna2

Ahora se viene lo bueno, ¡¿Qué es esta tabla enorme con muchos números?! Sencillo, es un resumen de nuestras 33 preguntas de síntomas de estrés. Nada más y nada menos. Los que aún siguen un poco nerviosos por esta tabla no hay problema, (aquí un poco de música relajante para calmar los ánimos).

Si bien aquí salen 4 columnas, las columnas más importantes para nosotros son las dos últimas hacia la derecha. La primera nos dice la correlación item-test. ¿Qué es esto? Es la correlación de los puntajes de cada pregunta con los puntajes totales de toda la prueba.  Pero en este caso, los valores sí pueden ir de -1 a 1. Pero lo que nosotros buscamos es que todos los valores sean positivos. Nuevamente, así como el Alfa de Cronbach, los puntajes deben ser altos. En ese caso, una clásica regla de dedo es que los valores deben ser mayores a .40 (Gliem & Gliem, 2003). Sin embargo, esto es bien discutible porque se pueden encontrar otras reglas de dedo con valores menores.

En nuestro caso, podemos ver que la gran mayoría de las preguntas funcionan bien con la excepción de la: 8, 12, 14 y 33. Esto lo sabemos porque la correlación ítem – test es menor a .40. En otras palabras, los puntajes de estos ítems no están fuertemente relacionados con el puntaje total de la prueba.  En general, cuando ocurre esto la lógica sería retirar los ítems que no funcionan bien del análisis. 

¡Pero no tan rápido! ¡Paremos el carro! Antes de hacer esto, es necesario ver a la última columna de la derecha, que es el “Alfa de Cronbach si es que se elimina el elemento”. Aquí, como el nombre lo dice, nos muestra cuánto subiría nuestro Alfa de Cronbach si es que retiramos el ítem (pregunta) de nuestro análisis. Si vemos en la columna, si retiramos los ítems 8, 12 y 14 el Alfa de Cronbach no subiría nada o subiría a penas un punto, entonces no vale la pena quitar esos ítems.

Por otro lado, si retiramos el ítem 33 (que tiene una correlación ítem-test de .078), aquí sí hay un cambio de 3 puntos en el Alfa de Cronbach. Por lo tanto, sería recomendable eliminar ese ítem de nuestra escala de estrés.

¿Cómo se elimina el ítem? Muy sencillo se vuelve a realizar todo la aventura con la única diferencia que esta vez no incluimos la pregunta 33 y listo (Aquí les dejo una tonada aventurera de los 80).

Ojo, pestaña y ceja (2): El Alfa de Cronbach asume por defecto Unidimensionalidad. ¿Uni…que? Esto quiere decir que interpreta que todas las preguntas que pongamos en el análisis generan un puntaje total único. Si tienen cuestionarios que tienen diferentes áreas o temas. Por ejemplo, 5 ítems miden autoestima, 6 ítems miden, identidad, etc. Es mejor utilizar el Alfa de Cronbach separando por cada una de las áreas.

¡Muy bien! Creo esto sería todo mis valientes lectores, ¡hemos logrado la hazaña! ¡Los felicito por ello! Recuerden que si tienen alguna pregunta pueden ir siempre a la parte de comentarios. Encantado de poder responderles y saber más de ustedes. Por último, un ojo, final.

Ojo, pestaña y ceja (3): Si bien el Alfa de Cronbach se ha mostrado como una aventura aparte, en general siempre que hagamos análisis inferenciales (ver post), cualquiera que hayamos visto en Stats SOS, siempre es importante antes analizar la consistencia interna de nuestros datos. ¿Por qué? porque sino estamos analizando datos y haciendo concluyendo sobre la base de datos que no son confiables. 

¡Perfecto! Para la siguiente aventura volveremos a nuestras queridas regresiones y las miraremos más a profundidad. En otras palabras, entraremos en la selva de la moderación y la mediación estadística. 

Espero que todos hayan experimentado una excelente aventura, siempre es muy agradable poder enfrentar estas aventuras con ustedes.

¡Buenas vibras para todos!

Referencias

George, D., & Mallery, P. (2003). SPSS for Windows step by step: A simple guide and reference. 11.0 update (4th ed.). Boston: Allyn & Bacon.

Gliem, J & Gliem, R. (2003). Calculating, Interpreting, and Reporting Cronbach’s Alpha Reliability Coefficient for Likert-Type Scales. Conference in Adult, Continuing, and Community Education. Midwest Research to Practice.

Sijtsma, K. (2009). On the use, the misuse and the very limited of the Cronbach’s Alpha. Psychometrika, 74(1) 107-120. DOI: 10.1007/S11336-008-9101-0

Anuncios

Acerca de Juan Carlos Saravia Drago

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
Esta entrada fue publicada en Básico 2.0 y etiquetada , , , , . Guarda el enlace permanente.

140 respuestas a ¿Tienes confianza? La confiabilidad y el Alfa de Cronbach

  1. Elena dijo:

    Buenos días,

    Me gustó mucho leer el post. En mi caso tengo un problema que no puedo responder. Tengo un instrumento que mide una dimensión ( desgaste por empatía) y esta a su vez se divide en otras 3 dimensiones. Resulta que estoy analizando el alfa de Cronbach del instrumento completo y me sale que tiene una puntuación buena ( 0.7..) pero cuando lo analizo por las 3 dimensiones que tiene el instrumento todas me dan una alpfa Cronbach muy baja (de 0.3 o 0.4). ¿Qué ocurre? ¿Eso es posible? Agradecería mucho tu comentarios.
    saludos.

    Le gusta a 1 persona

    • Estimada Elena,

      Muchas gracias por escribir a Stats SOS. Sí es posible, dos cosas pueden pasar. Que ese grupo de ítems no discriminan las personas que tienen mucho o poco desgaste porque todos dan respuestas parecidas.

      Por otro lado, la cantidad de ítems por lo general lleva a que tengas menor variabilidad y por eso es que los alfas son tan bajos. Mis dos respuestas están relacionadas entre sí.

      ¡Mucho éxito!

      Me gusta

  2. Anónimo dijo:

    hola buenas noches, pues solo quisiera saber .. cual seria mi respuesta ante la siguiente pregunta. por que o debido a que mi alfa dio como resultado un coeficiente de 0.935? …así mismo también quisiera saber … por ejemplo al momento de analizar en el SPSS las correlaciones bivariadas .. me indica que algunas preguntas puedo invertirlas y así de esa manera también aumentar mi alfa … estaría correcto para la investigación hacer eso? o ya se llamaría manipulación cosa que no debería de existir en una investigación no experimental? … agradecería si me podría contestar esas dudas que tengo por favor … saludos desde Perú.

    Me gusta

    • Estimad@,

      Muchas gracias por escribir a Stats SOS. Si el alfa sale alto quiere decir que la prueba es confiable y que los ítems se relacionan entre sí y permite generar un puntaje único. Personalmente no invertiría los ítems porque la máquina me lo dice sino tendría un criterio teórico detrás de ello.

      ¡Mucho éxito!

      Me gusta

  3. Anónimo dijo:

    Buenas tardes ,
    porque me sale mi alfa 0.16? es malo eso?

    Me gusta

    • Estimad@,

      Muchas gracias por escribir a Stats SOS. Dado que el alfa de Cronbach debe ser lo más cerca a 1.00 posible entonces diría que sí. Es muy baja la confiabilidad. Es posible que los ítems no se relacionen entre sí o no haya variabilidad entre las respuestas (que todos marcan la misma opción).

      ¡Mucho éxito!

      Me gusta

      • Tomas Flores dijo:

        Si se toma datos basicos el alfa sale en bajo nivel, para su calculo recalcular con variable suma incluida y asumir este dato en la validacion

        Me gusta

        • Estimado Tomas,

          Muchas gracias por escribir a Stats SOS. No se si metería dentro del análisis la sumatoria de todos los datos porque tendrías un problema de duplicidad de datos que generaría algo que le llaman multicolinealidad. Personalmente, no es algo que haría.

          ¡Mucho éxito!

          Me gusta

  4. Gabriela Irene Rodríguez Gámez dijo:

    Buen día
    Quisiera saber si existe alguna diferencia entre confiabilidad de alfa (alpha reliability) y alfa estandarizada (standardized alpha)? Debido a que en el paquete estadístico R commander me arroja ambos datos. Sé que el alfa estandarizada refiere a la relación que existe entre los reactivos, pero, entonces ¿A qué refiere la confiabilidad de alfa que arroja R en este caso?
    Espero haber sido clara y me pueda apoyar con esta duda
    Gracias de antemano

    Me gusta

    • Estimada Gabriela,

      Muchas gracias por escribir a Stats SOS. Solo se diferencian en la manera de calcular el índice. El alfa normal se calcula usando las varianzas (matriz de varianza covarianza) y el alfa de cronbach estandarizado utilizando las correlaciones de los ítems (matriz de correlaciones).

      En ese caso utiliza insumos distintos para hacer el cálculo.

      ¡Mucho éxito!

      Me gusta

  5. amacias182 dijo:

    Esto de alfa de cronbach se hace despues de haber aplicado el cuestionario por lo que entiendo??? Y la otra pregunta, entonces para lo que sirve es para determinar si las personas nos contestaron a lo loco o si en realidad si fueron respuestas verdaderas??? es decir, su utilidad es ver que lo que contestaron en verdad lo piensan???

    Me gusta

  6. Anónimo dijo:

    holaa en la columna de correlacion total corregida tengo algunos valores negativos , seria necesario eliminarlos o puedo trabajar con ellos normalmente? gracias

    Me gusta

    • Estimad@,

      Muchas gracias por escribir a Stats SOS. Recomendaría eventualmente anularlos. Pero antes de eso, sacaría estadísticos descriptivos sobre esos ítems complicados. La distribución de las respuestas podría darte ideas de cómo es que la gente está respondiendo los ítems.

      ¡Mucho éxito!

      Me gusta

  7. Anónimo dijo:

    Muy buena explicación, además muy detallados ejemplos, pero quiero saber con exactitud qué quiere decir en mi tesis Rho=.574 entre la gestión administrativa y a enseñanza…Muy agradecida..

    Me gusta

  8. Anónimo dijo:

    Hola! Una consulta, si en un cuestionario tengo varios tipos de preguntas (dicotómicas, respuesta múltiple, etc) y solo 2 con escala likert con pocos ítems. Es válido usar en ese caso el alfa de cronbach o es mejor usar otros estadisticos? Ya que una de mis variables puede incluir una pregunta de respuesta múltiple como una likert.

    Me gusta

    • Hola,

      Muchas gracias por escribir a Stats SOS. Para curarte en salud yo solo pondría dentro de la prueba de alfa de cronbach preguntas que tengan respuestas politomicas. El problema es que el alfa no funciona muy bien con preguntas dicotomicas.

      Mucho éxito!

      Me gusta

  9. James dijo:

    Hola, me guastaria saber que pasa cuando el resultado es mayor a uno. R:1.52

    Me gusta

  10. Omar Garcia dijo:

    Buenos dias, que me puede decir sobre la confiabilidad interobservador .cuando se da y como ..Gracias

    Me gusta

    • Estimado Omar,

      Muchas gracias por escribir a Stats SOS. La confiabilidad entre observadores se refiere al nivel de concordancia que hay entre ellos. Esto se da cuando se hace una observación ya sea de aula o de cualquier fenómeno donde múltiples personas observan un fenómeno y ven por ejemplo cuanto se repite el mismo. Luego se ve entre los observadores cuantos de ellos estuvieron “de acuerdo” con el nivel de repeticiones. Los acuerdos se dividen entre el total de observadores y ahí se obtiene un coeficiente.

      Mucho éxito!

      Me gusta

  11. Alberto dijo:

    Yo lo veo así, dime si estoy mal porfavor. Supongamos que soy un profesor que le aplica 50 examenes sobre ingles (que maestro tan perro por cierto jaja) en el semestre a mis alumnos, (los examenes equivalen a cada uno de los 50 reactivos de un hipotetico cuestionario), y al final, si saco el promedio que sacaron mis alumnos en todos ellos es de 8.3. Si me pongo a ver las calificaciones promedio de todo el salon en cada uno de los examenes tendre los siguientes puntajes: 7.5, 8.5, 7, 8.7 y así. Entonces en el momento en que vea que en un examen el promedio fue de por ejemplo 5.7, eso me bajara mi coeficiente de confiabilidad, mi consistencia interna… entonces en el momento en que elimino ese 5.7, es decir ese examen (entiendase por reactivo) de mi evaluación total, subira mi alfa de cronbach, es masomenos asi la logica Juan Carlos?? Mil gracias por tu tiempo y conocimientos, eres el mejor!!

    Me gusta

    • Estimado Alberto,

      Muchas gracias por escribir a Stats SOS y por tus palabras. Sí, es más o menos así. La diferencia es que no es a nivel de todo el examen sino a nivel de las preguntas. Si en un reactivo todos te responden lo mismo (se equivocan o aciertan) ese ítem no está discriminando si una persona es buena o no tan buena. Por ello, la varianza (las diferencias) no se captan y entonces la confiabilidad cae.

      Mucho éxito!

      Me gusta

  12. jessica marchan vargas dijo:

    hola! me encanto tu enseñanza. una consulta, que pasa cuando me sale – ,014 que puede haber fallado? y como solucionarlo por favor.

    Me gusta

  13. Carlos dijo:

    Hola una consulta, como usted lo tomaría si la confiabilidad de las 2 variables juntas me sale 0.875, pero si saco por separados la primera variable me sale 0.817 y la segunda variable me sale 0.743. esta segunda variable estaria bien ? puesto que dicen que un resultado 0.7 es aceptable pero un 0.8 es muy bueno.

    Me gusta

  14. René Arenas dijo:

    Excelente material, felicidades una consulta: cuando el alfa sale negativo: -0,765, como habría que interpretarlo

    Me gusta

  15. Rene dijo:

    Saludos y muchas gracias por el contenido. Mi consulta es:
    Tengo 2 escalas que quiero correlacionar, la primera de ellas tiene 4 dimensiones( 4 items por dimensión) y la otra es unidimensional(10 items ), mi pregunta es si en caso la confiabilidad que obtenga por cada una de las dimensiones sea baja (menor a 0.7) podría correlacionar cada una de estas dimensiones con la otra escala de 10 items, o es que la baja confiabilidad seria un inconveniente para realizar un análisis correlacional?

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s