¿Muestras no paramétricas relacionadas? La W-wilcoxon

Estimados todos, bienvenidos a una nueva aventura de Stats SOS. Espero que estén muy bien. En el capítulo de hoy estamos de vuelta en el mundo no lineal. Así es, en la aventura de hoy, veremos el análisis del título de hoy. Aunque no lo crean, ya hemos visto ciertos elementos que nos podrán ayudar a entender con mayor facilidad este análisis.

¡Vamos a lo nuestro! El post de hoy, es describir de manera sencilla la W de Wilcoxon. Como ya mencioné, este análisis es no lineal. Pero además, se utiliza cuando ocurren dos cosas: a) tenemos muestras relacionados y b) cuando nuestros datos son ordinales o tienen una distribución no normal. Con calma, los que no recuerdan qué es un dato ordinal siempre pueden ir ha este episodio 🙂

En ese caso, este análisis, en sencillo, podría decirse que es la versión no lineal y no normal de la t-student de muestras relacionadas. Los que no recuerdan qué es este análisis siempre pueden ir a este post como un recordatorio :). Por otro lado, los que no recuerdan qué es una muestra no normal, ¡No hay problema! Siempre pueden volver a este post que les puede dar ciertas ideas.

Antes de comenzar nuestro ejemplo sería genial poder preparar todo el escenario para mostrar la W de Wilcoxon. Entonces, hasta ahora hemos dicho dos cosas: a) utiliza muestras relacionadas, b) usa datos ordinales  y ahora agregaré tres más: c) por defecto utiliza rangos promedio (ver post), d) cuando se quieren comparar dos mediciones de intervalo que la distribución no es normal se usa la mediana (ver post) y e) el análisis es útil para analizar un mismo grupo al que se le ha hecho dos mediciones en momentos distintos. Este análisis no se puede hacer con más de dos mediciones.

¡Excelente ahora vamos a lo nuestro! (tambores de entrada), un ejemplo. Imagínense que queremos ver si es que la música clásica realmente nos ayuda a recordar mayor información. En ese caso, juntamos 32 jóvenes y hacemos la siguiente tarea:

Paso 1: Les mostramos 15 palabras, a los jóvenes en una presentación y la exposición de cada palabra dura 5 segundos. Luego que terminamos, les entregamos una hoja de papel y les pedimos que escriban todas las palabras que recuerdan. Esta sería nuestra primera medida, la variable A que llamaremos, “pre-música”

Paso 2: Luego de una semana, recopilamos a los mismos jóvenes y les mostramos las mismas 15 palabras, en la misma cantidad de tiempo, pero en este caso mientras que hacemos la presentación de las palabras, les ponemos a los participantes como música de fondo Ave María de Schubert, (aquí la tonada). Luego de las 15 palabras, repetimos la misma tarea, les entregamos una hoja de papel a los participantes y les pedimos que escriban todas las palabras que recuerdan. Esta sería nuestra segunda medida, la variable B que llamaremos “música”.

¡Excelente, luego de recopilar toda la data, la ponemos en el paquete estadístico (en este caso utilizaremos SPSS) y analizamos la información.

¿Analizamos la información? ¡Un momento! Antes que nada debemos ver si ambas medidas tienen puntajes con distribución normal.

Para ello, debemos seguir la siguiente ruta:

Analizar/Frecuencias/Estadísticos/

Aquí, pinchamos (o hacemos click) en asimetría, curtosis y mediana (al igual que en la U de Mann Whitney esto se usa luego). Luego en la casilla que dice Variables debemos poner nuestra Variable A y B. Después, Aceptar.

¡Muy bien! Ahora debemos percatarnos si es que la asimetría es mayor a 3 y la curtosis mayor a 8, que muestra que los puntajes de una medida no tienen una distribución normal. (Kline, 1998; 2005). Para el ejemplo, asumamos que este caso se dio.

Luego de ello, vamos al análisis. Para ello, debemos de seguir la siguiente ruta:

Analizar/Pruebas no paramétricas/Cuadros de diálogos antiguos/2 muestras relacionadas.

¡Listo! Esta ruta se sigue, porque queremos hacer un análisis que no asume que nuestros puntajes tienen una distribución normal, los cuadros antiguos porque somos old school 🙂 y 2 muestras relacionadas porque se mide al mismo grupo dos veces a lo largo del tiempo. 

Luego, nos aparecerá un cuadro de diálogo y ahí tenemos que poner nuestras variables. Ahí veremos que sale un cuadro llamado Contrastar pares. En este caso, en variable 1 tenemos que poner nuestra medición previa que la llamamos “pre-música”, luego en variable 2 es necesario que pongamos la segunda variable que en nuestro ejemplo se llama “música”. Por otro lado, para que sea más fácil reportar nuestros resultados, podemos ir a opciones y marcar en la casilla de descriptivos y poner continuar. 

¿Vamos bien? ¡Sigamos adelante! Seguidamente, debemos de poner el análisis que queremos hacer. Ahí hay varias opciones, pero nosotros para este caso queremos utilizar Wilcoxon entonces, hacemos click (pinchamos) en esa opción y ponemos Aceptar. Ojo pestaña y ceja: Siempre hay que revisar esto no vaya a ser que terminemos realizando otro análisis. 

Bueno, después de un recorrido largo comenzamos en la etapa final de nuestro post. ¡Los análisis de nuestras tablas!

Aquí nos aparecerán las siguientes 3 tablas:

Tabla 1:

descriptivosWilcoxonEsta tabla lo único que nos muestra son los estadísticos descriptivos de nuestras variables y la cantidad de personas por grupo (N). Los que no recuerdan qué son estadísticos descriptivos, siempre pueden volver a este post.

Tabla 2:

rangospromediosWilcoxon

Esta tabla como ya comentamos anteriormente nos muestran los rangos promedio. Esta tabla tan solo la he puesto para que podamos ver que el SPSS utiliza por defecto los rangos promedio para calcular la W de Wilcoxon. Los que no recuerdan qué son los rangos promedio siempre pueden volver a este post. En general, estos resultados lo que nos está diciendo es que se están comparando los puntajes de Música y Pre Música. Entonces, lo que hace el SPSS es hacer un conteo (La N) de cuántas personas tuvieron menos puntaje en la prueba con música que sin música (Rangos negativos, que es igual a 13). Aparte, cuantas personas tuvieron más puntaje en la prueba con música que sin música (Rangos positivos, que es igual a 12). Finalmente, cuándo el puntaje de pre música y música fueron iguales (Empates, que es igual a 7). Aparte, como ya mencione nos muestra los rangos promedio y la suma de rangos promedio.

Tabla 3

 SignificanciaWilcoxon

Esta tabla es la más importante de nuestro análisis.  Nos muestra el valor Z (que es acorde a las tablas de significancia, estas tablas las pueden encontrar en este post). Entonces, está tabla lo que nos dice es si comparamos los puntajes de música y pre música, obtenemos un puntaje Z igual a (-.514), para este caso no iré a la matemática, pero para obtener este resultado se realiza un cálculo con una fórmula (los interesados siempre pueden dejar un comentario :)).

Además, para un puntaje Z de -.514, se obtiene una significancia de .607. Esto como nosotros muy bien sabemos es claramente no significativo porque está muy por encima de 0.05. Esto demuestra, que no hay diferencias significativas entre la capacidad para recordar palabras con o sin música.  Los que no recuerdan por qué llegamos a esta conclusión siempre pueden ir a este post que les puede ayudar a refrescar la memoria.

¡Muy bien! Aún no satisfechos con este resultado, por si acaso revisamos las medianas de las dos mediciones nos encontraremos que la mediana es igual a 5 en ambos casos. Ello refuerza el hallazgo de la tabla 3 que nos propone que no hay diferencias entre las dos medidas. Para este caso no he puesto la tabla para no llenarnos de tablas :).

¡Muy bien! Creo que esto sería todo por hoy, espero que esta aventura les haya gustado. En broma y broma ya hemos visto varios análisis: las comparaciones de grupos independientes y dependientes  de muestras con puntajes con distribución normal (ver enlaces en los nombres).  Así como la comparación de grupos independientes y dependientes con puntajes que tienen una distribución no normal. Para la siguiente aventura relacionada a este tema, iremos un paso más adelante. Ya no solo sabremos, que hay diferencias sino cuán grandes son estad diferencias y para ello utilizaremos algo llamado tamaño del efecto. 

¡Así que estén muy preparados! Pero ustedes valientes lectores son unos guerreros entonces estoy seguro que no tendrán ningún problema.

Recuerden que siempre es un placer recibir comentarios en la sección posterior. Aparte, los interesados en seguir las aventuras de este blog siempre pueden ir al botón Seguir que se encuentra arriba de su pantalla.

¡Muy buenas vibras!

Referencias

– Kline, R. B. (1998). Principles and practice of structural equation modeling. NY: Guilford Press.
– Kline, R.B. (2005), Principles and Practice of Structural Equation Modeling (2nd Edition ed.). New York: The Guilford Press.

Anuncios

Acerca de Juan Carlos Saravia Drago

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
Esta entrada fue publicada en Básico 2.0 y etiquetada , , . Guarda el enlace permanente.

2 respuestas a ¿Muestras no paramétricas relacionadas? La W-wilcoxon

  1. Paola dijo:

    Buenos dias… Gracias por tu explicación… quería consultarte por el tamaño del efecto… ¿Es relevante reportarlo en este tipo de prueba? ¿con que estadístico se efectúa? ¿como lo estimamos en SPSS?

    Gracias

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s