Orden y relación: la correlación de Spearman

Estimados todos, como siempre bienvenidos a una a maravillosa aventura de Stats SOS. En la aventura de hoy, nos iremos en avanzada como dicen y estiraremos un análisis que ya hemos trabajado. Como ustedes, mis jóvenes y valientes lectores ya hemos surcado por las tierras de la correlación de pearson. Ahora, digamos que pasaremos por su prima, la correlación de Spearman.

En ese caso, el objetivo de hoy es describir y comprender, qué demonios es la correlación de Spearman. Sin mucho rodeo, ni tanto vuelo, ¡Aquí vamos! La correlación de Spearman es un análisis de relación entre dos variables que son ordinales. Pero, pero, pero…¿¡qué diablos es un variable ordinal!? Muy sencillo, es una variable que tiene orden y jerarquía y no es continua. Los que quieren mayor información sobre ella, siempre pueden volver en el tiempo y aterrizar acá.

¡Fantástico! Ya tenemos la primera parte del asunto, ahora vamos a lo otro. La correlación de Spearman tiene como objetivo observar en variables ordinales cuán monotónica es la relación entre estas dos variables.  Mono…¿qué? Pero si los únicos monos son los que hay en la selva…¡Maldición! calma, calma, respiren, ¿Ya, están más tranquil@s? ¡Genial sigamos! Una relación monotónica es cuando dos variables están en forma de “S”, para que no suena a una lengua oscura, con magia negra y maldad veamos un ejemplo  gráfico:

 

figure3

 

En este caso, al igual que la correlación de Pearson, la correlación de Spearman puede tener variables entre -1 y 1. La figura (a) muestra dos tipos de relación  o líneas, una roja y una azul. La línea azul que es curvilínea es una relación monotónica positiva. En cambio, la línea roja es a clásica forma de una correlación de pearson positiva. Por otro lado, la figura b) muestra dos línea, la línea azul es una relación monotónica negativa entre dos variables, en cambio la línea roja es una clásica relación lineal de pearson negativa.

¿Hasta ahí todo bien? Estoy seguro que si. Ahora para no atorarnos vamos a un ejemplo :):

Imagínense que queremos ver la relación que existe entre la percepción de salud y la frecuencia en que hacen deporte un grupo de 600 jóvenes. Para ello, utilizamos un cuestionario donde preguntamos ¿Cómo consideras tu salud? y las opciones de respuesta son “mala”, “regular” y “buena”. Por otro lado, para preguntar la frecuencia en que los jóvenes hacen deporte utilizamos la siguiente pregunta: “¿Con qué frecuencia haces deporte? “Nunca”, “Algunas veces” y “Siempre”. ¡Perfecto! Ahora, podemos observar que ambas preguntas son variables ordinales dado que tienen un orden (por ejemplo para pasar de “nunca hago deporte” a “siempre hago deporte” tienes que pasar por “algunas veces hago deporte”, en otras palabras existe un orden de intensidad, esto mismo se puede decir sobre la percepción de salud.

¡Genial! Ahora que vimos esto, podemos decir que necesitamos una correlación de Spearman para encontrar la relación entre percepción de salud y frecuencia en que los jóvenes hacen deporte. 

Para ello, debemos seguir la siguiente ruta:

Analizar/correlaciones/bivariadas/

Aquí es importantísimo que hagamos dos cosas: 1) Introducimos percepción de salud y frecuencia para hacer deporte en la casilla de la mano derecha. Luego de ello, es necesario que veamos abajo donde nos van a salir casillas con nombres de análisis. Aquí, tendríamos que dejar en blanco la casilla que dice correlación de pearson y marcar la que dice correlación de spearman.  Luego de ello, lo único que tenemos que poner es el mítico “Aceptar”.

¡Genial! Luego de poner aceptar seguramente nos saldrá un cuadro más o menos así:

spearman

Este cuadro lo único que me dice es cuán relacionadas están la percepción de salud y la frecuencia en que los jóvenes hacen deporte. Aquí, tenemos buenas noticias, hay relación entre ambas variables. ¡Maravilloso! Pero, pero pero, ¿cómo me doy cuenta que hay relación? Muy sencillo, debo ver dos números:

  1. Cuando veo la significación (sig bilateral) puedo ver que es menor a 0.05 entonces la relación entre percepción de salud y frecuencia de practicar deporte en jóvenes es estadísticamente significativa. En otras palabras, hay relación entre las variables. Ahora…pero…¿cuán relacionadas están las variables? ¡Muy sencillo! Para ello debemos pasar al siguiente paso.
  2. En este caso, debo ver la casilla que dice “coeficiente de correlación” que me muestra que hay una relación positiva de .254 entre percepción de salud y frecuencia de práctica deportiva en jóvenes. Esto quiere decir, que a mayor percepción de salud, mayor es la frecuencia en que los jóvenes prácticas deporte. 

¡Bueno! ¿Cómo van? ¿Bien? ¿Muertos agotado, cabizbajos y meditabundos? ¡Seguramente que no, mis valientes lectores! Bueno ahora que sabemos los resultados, no hay más nada. Como ven la correlación de Spearman no es un análisis tétrico y complicado de realizar, todo lo contrario es sencillo y muy útil sobretodo si se tienen preguntas o variables que son ordinales. 

¡Muy bien! Eso sería todo por hoy, espero que lo hayan disfrutado de nuestra maravillosa aventura llena de relaciones y curvas en forma de S. Recuerden que siempre pueden dejar sus maravillosos comentarios y también pueden seguirnos en la página de Facebook de Stats SOS o también nos pueden seguir en Twitter en @StatsSOS. Para el próximo capítulo saltaremos nuevamente a relaciones lineales pero haremos algo un poco más complejo, de todos modos estoy seguro que será re fácil para ustedes. Igual los dejo con la curiosidad :).

¡Nos vemos y que estén muy bien!

 

Anuncios

Acerca de Juan Carlos Saravia Drago

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
Esta entrada fue publicada en Uncategorized y etiquetada , , . Guarda el enlace permanente.

9 respuestas a Orden y relación: la correlación de Spearman

  1. Angel Gomez de G. dijo:

    Estimado Juan Carlos Sarabia, le saludo y espero se encuentre bien, deseo saber si es posible saber donde tiene usted su sede, para tratar posible alianza, en caso de que usted pudiese estar interesado. Mi respeto.

    Muchas Gracias

    Ángel Gómez Degraves, Ph.D

    Me gusta

  2. Anónimo dijo:

    Estimado,

    Dos consultas:

    a) Muchas veces la gente confunde si para realizar correlaciones es necesario saber si la muestra es o no paramétrica. Por ejemplo, hay que gente que cree que Spearman tiene que ver muestras no paramétricas y Pearson con paramétricas. ¿Tiene algo que ver la normalidad para decidir si usar Pearson o Spearman en correlaciones o, como explicas acá, tiene que ver con la naturaleza de la variable: escala y ordinal?

    b) Ello me lleva a mi siguiente pregunta: Si en mi base tengo 4 variables a analizar (por ejemplo). La 1y la 2 son ordinales, pero la 3 y la 4 son de escala. Ello implica que para ver la correlación entre la 3 y 4 utilizó Pearson (porque ambas son de escala), pero para comparar la 1 y la 3 utilizo Spearman. Es decir, ¿Cuándo hay una variable ordinal y una de escala utilizó Spearman? Entonces, cuando explico mis resultados digo: ¡Se utilizó Correlación Spearman entre la variable 1 y 3, pero Pearson para 3 y 4?

    Muchas gracias por tu tiempo.

    Saludos.

    Me gusta

    • Estimad@,

      Muchas gracias por escribir a Stats SOS. Tal como pusiste viñetas en las preguntas, haré lo mismo para responder.

      a) La respuesta es no. Ninguna de las dos tiene que ver con la distribución de los datos. La correlación de Pearson expresa una relación lineal entre dos variables. En este caso, ambas variables deben ser de intervalo o razón. En el caso de la correlación de Spearman, los datos deben ser ordinales y la relación entre ambas variables es Monotónica, (no lineal). Esa es la gran diferencia entre ambas. Si corres Spearman con datos continuos automáticamente el paquete estadístico va a convertir tus números a ordinales (en sí los convierte en rangos promedios, ver: https://statssos.net/2015/04/01/que-rango-tiene-usted-los-rangos-promedios/). Entonces, ahí estarías cayendo en un error porque la correlación ya no calcula los valores que respondió la gente sino el orden en que estos valores están puestos.

      b) Hay un dicho que es papas con papas y camotes con camotes. Para hacer una relación entre dos escalares usaría Pearson. Si tengo una ordinal y una escalar y quiero ver la relación entre ambas haría un ANOVA. Al fin y al cabo, el test de ANOVA es un análisis lineal que ve la relación entre múltiples categorías (que pueden ser ordinales) y una variable que es continua. La correlación de Spearman solo la utilizaría si es que tuviera ambas variables ordinales. Entonces, para 3 y 4 Pearson y para 1 y 3 ANOVA. Si quieres relacionar 1 y 2 usaría Spearman.

      ¡Mucho éxito!

      Me gusta

  3. Jorge dijo:

    Hola, muy interesante el tema. ¿Podrías explicar un poco mas sobre el uso del test de ANOVA mencionado en la pregunta anterior?.

    Me gusta

  4. Anónimo dijo:

    Hola Juan Carlos. Explicas muy bien cuando aplicar la correlación de Spearman y su tipo de relación (monotómica). Mi pregunta es: cuando en un cuestionario presentado por items, tengo por ejemplo 5 items que miden el positivismo y otros 5 que miden el materialismo (todos ellos codificados de 1 nada de acuerdo a 5 muy de acuerdo), si para conocer estos indicadores, sumo los 5 de cada indicador para obtener 2 variables que indiquen estos índices. Si quiero medir la correlación entre materialismo y positivismo de estas dos nuevas variables que son el sumatorio de sus respectivos 5 items, que debo emplear una correlación bivariada de Spearman o Pearson al ya no estar ordenados los valores de 1 a 5 (sino su sumatorio o media si fuera el caso)?

    Muchas gracias

    Me gusta

    • Estimad@,

      Muchas gracias por escribir a Stats SOS y por el comentario sobre cómo explico los post. Dado que has sumado puntajes de áreas en este caso no es necesario realizar una correlación de Spearman. Por ello, la vía que tendrías que ir es realizar una correlación bivariada de Pearson.

      ¡Mucho éxito!

      Me gusta

  5. Anónimo dijo:

    Gracias!

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s