¿Que es la estadística descriptiva? ¿Cómo se come?

Recuerden la estadística es la ciencia que utiliza conjuntos de datos numéricos para obtener inferencias basadas en el cálculo de probabilidades. En ese caso, no es una ciencia exacta, sino el arte de las probabilidades.

En el post de hoy, definiremos fácilmente la estadística descriptiva. Además, expondremos los principales conceptos de este tipo de estadística y presentaremos ejemplos para cada uno.

Aunque no lo crean, usamos constantemente la estadística. Por ejemplo, si decimos “Tal vez jale la prueba preparatoria” o “Quizá vaya al cine” estamos hablando de probabilidades. Tan sencillo como eso.

Ahora, vamos un paso más allá. En general, en la estadística clásica existen dos tipos: la estadística descriptiva y la estadística inferencial. Por motivos prácticos, en este primer post solo tocaremos la estadística descriptiva.

Antes de empezar, quiero adelantarles algo muy importante: este tipo de estadística no es la que más se usa en psicología. En otras especialidades como la epidemiología o demografía, se utiliza mucho este tipo de estadística. Asimismo, si revisan informes anuales de los Ministerios encontrarán que la emplean constantemente para informar datos descriptivos: cuántas personas han acudido al hospital en un periodo de tiempo; cuántos peruanos tienen trabajo: cuántos niños y adolescentes estudian en escuelas públicas, etc.

Entonces, la estadística descriptiva, como su nombre lo dice, lo que pretende es describir. Así como nosotros describimos, por ejemplo, una pintura y decimos “Es bonita, tiene colores azules, verdes, representa esto, etc.”, este tipo de estadística hace lo mismo. ¿Cómo describe? Usando su propio lenguaje. Así como nosotros usamos el lenguaje, la estadística usa la media, la mediana, la moda, la desviación estándar y la varianza para describir poblaciones.

Antes de ir a un ejemplo pasaré a definir, en pocas y simples palabras, qué es cada una:

 La media: Es el promedio de puntajes de un grupo o varios grupos. Por ejemplo, si tenemos 20 personas y 10 tuvieron 20 en su examen de estadística y las otras 10 sacaron 15, entonces el promedio de la clase es de 17.5. Esto se da porque sumamos todos los puntajes o notas que obtuvieron (de ahí sale el término “Sumatoria” al que tanto temor le tenemos “Σ”) y lo dividimos entre la cantidad de alumnos (20 en este caso).

 La mediana: Es el punto céntrico que se obtiene de varios números que están ordenados. Por ejemplo, si tenemos 5 números, (1,2,3,4,5), la mediana en este caso es “3” porque es el valor que está en el medio (1,2,3, 4, 5). Entonces hay la misma cantidad de números para la derecha como para la izquierda. Ojo, pestaña y ceja, para sacar este puntaje los números deben estar ordenados correlativamente (de menos a más).

 La moda: Como su nombre lo dice, es el puntaje “que está de moda”. En otras palabras, el que se repite más. Por ejemplo, en un grupo de números: 1,2,2,3,4,5. La moda es “2” porque se repite dos veces, a diferencia de los otros números que solo se repiten 1 sola vez.

¡Ya ven! ¡Es sencillo y puede ser bastante amigable!

Sigamos. La desviación estándar o desviación típica: Es un estadístico que te dice cuánto los puntajes se alejan de la media. En otras palabras, cuánto la distribución o cantidad de puntajes que hay en un grupo se alejan del promedio. Vamos con un ejemplo: están haciendo una investigación y le toman una prueba de stress a 10 personas. En una prueba de stress donde puedas puntuar como mínimo 5 y como máximo 60, estas 10 personas tienen los siguientes puntajes: (20,30,45,23,50,37,42,10,9,17). Esto nos da una media de: 28.3. En otras palabras, el grupo tiene un puntaje promedio de 28.3 de stress. Esta media tiene una desviación estándar de 14.71. Eso quiere decir que los puntajes de todo el grupo de personas se alejan del promedio (28.3) en 14.71. Esto puede darse hacia la derecha (28.3 + 14.71 = 43.01) así como para la izquierda (28.3 – 14.71 = 13.59). Si alguien está interesado en la fórmula de la desviación estándar puede ir a la parte de comentarios de este post y ahí obtendrá la fórmula. En sí, he intentado poner la menor cantidad de fórmulas posible ya que hoy en día los paquetes estadísticos hacen los cálculos, lo importante es que tengamos claros los conceptos.

Entiendo que este concepto puede ser un poco fastidioso, pero es muy útil, por ejemplo, cuando se quieren conocer los puntajes de elecciones municipales. Por ejemplo, si un candidato “A” tiene un porcentaje de aprobación promedio de 41% con una desviación estándar de 5%, entonces sus puntajes pueden ir del 36% al 46%. Si el candidato “B” tiene un porcentaje de aprobación promedio de 38% y con una desviación estándar de 4%, sus puntajes pueden ir del 34% al 42%.

Lo anterior quiere decir que, en un momento, el candidato “A” puede tener más aprobación que el “B”. En otro, el “B” puede tener más aprobación. Entonces, aún no se puede determinar un claro ganador ya que los puntajes de aprobación pueden variar o poner a cualquier de los dos como ganador.

Espero que no se desanimen después de esta explicación y sigan leyendo ¡Ustedes pueden! Vamos para adelante con la varianza.

 La varianza: Es, en sencillo, el cuadrado de la desviación estándar. Entonces, ¿deben tener algo en común, no? Bueno, lo tienen.

La varianza representa cuánto varían todos los puntajes del grupo. Volvamos al ejemplo de las 10 personas y el estrés. Si la desviación estándar es 14.71, entonces la varianza es 216.38 (si no me creen saquen la calculadora de la computadora y multipliquen 14.71 por 14.71 y verán :)). Esto quiere decir que los puntajes de estas 10 personas varían en 216.38. Si bien esto es ahorita un poco borroso, veremos que en estadística inferencial este término será vital e importantísimo.

Bueno, creo que un merecido descanso para todos eso lo mejor. Si han llegado hasta acá y no murieron en el intento, ¡Los felicito! ¡Muchas buenas vibras y hasta la próxima! En el siguiente capítulo veremos Estadística inferencial, que suele hacerse en psicología. ¡Hasta la vista!

Bibliografía recomendada

Coolican, H. (2014). Research Methods and Statistics in Psychology. Psychology Press: USA.

Anuncios

Acerca de Juan Carlos Saravia Drago

Magister de Estadistica aplicada a las ciencias sociales (Quantitative analysis for the social science). Katholieke University of Leuven (KUL). Magister en psicología clinica y de la salud de la Pontificia Universidad Católica del Perú (PUCP). Especialista en análisis cuantitativos en promoción de la salud, estrés, salud ocupacional y en jóvenes.
Esta entrada fue publicada en Conceptos y etiquetada . Guarda el enlace permanente.

20 respuestas a ¿Que es la estadística descriptiva? ¿Cómo se come?

  1. Beatriz dijo:

    Sigue para adelante con el Blog!

    Me gusta

  2. Para los interesados, la desviación estándar se obtiene de la siguiente manera: Sacas el promedio de tu grupo con los siguientes puntajes: (20,30,45,23,50,37,42,10,9,17). El promedio de esas 10 personas equivale a 28.3. Luego, restas el promedio de cada uno de los puntajes de cada sujeto: 20 – 28.3, 30 – 28.3, etc. El resultado de cada una de las restas las sumas y luego ese resultado, lo elevas al cuadrado. Luego que tienes ese número lo divides entre la cantidad de sujetos (en este caso 10). Finalmente, el número que te salió de todas esas operaciones le sacas la raíz cuadrada y ¡bum! tendrás 14.71. Otra opción es que le pidas al SPSS que lo haga por ti. 🙂

    Me gusta

    • mbenitesd dijo:

      Genial la publicación, impresionante tu añadido.

      Aun recuerdo el curso Estadística en EE.GG.LL. Nos pidieron llevar calculadora científica para hacer esos análisis. Yo, muy humildemente llevé mi calculadora. Hice todos los análisis con mi calculadora (herencia) que solo tenía funciones básicas. Fue impresionante todo lo que ponía para lograrlo. Fui el único estudiante que llenó todo el cuadernillo y que sacó un 20 en esa prueba.

      Me has hecho recordar buenas épocas entre yo y ella (la Estadística)… Épocas que nunca más volverían si no fueran por este blog. ¡Gracias!

      Me gusta

      • ¡Gracias Moises por tu comentario! Me alegra tener lectores tan motivados en el tema como tu. ¡Sí! Se suele empezar con la calculadora, es impresionante como haces tantos pequeños cálculos para llegar al número necesario.
        Eso me hace pensar en lo impresionante que es la tecnología y que la computadora hace miles de cálculos en fracción de segundos. ¡Gracias a ti! ¡Un abrazo!

        Me gusta

    • Maria Paz dijo:

      Osea a cada numero de la muestra le resto el promedio? Eso dejaria mas claro el concepto, estoy sufriendo para entender, casi he muerto en el intento.
      Estaba pensando si la Desviacion Estandar te dice “cuánto los puntajes se alejan de la media”, porque la media + la desviacion estandar no suma tu resultado mas alto de la muestra (50 en tu ejemplo): y, si le restas a la media la desviacion estandar te daria el mas bajo de tu muestra.
      Creo que mirando la formula se hace mas claro el concepto, no se :s

      Me gusta

      • Hola Maria Paz, a ver, respira. Sí, puedes decir cuanto varía o los puntajes se alejan de la media. Así es. En realidad, mirando las formulas, sí sigues los conceptos sí se vuelven más claros. Pero vas por buen camino.
        Para sacar la desviación puedes hacerlo también con la formula de varianza:
        (1/ n -1)*(Suma(Puntaje – Media de todos los puntajes)) al cuadrado.
        Luego que tienes la varianza solo le sacas la raiz cuadrada y listo.

        Las formulas te resumen todo, lo más importante es entender el concepto para luego aplicar la formula. Espero que te haya ayudado.

        ¡Suerte! y ¡Buenas vibras!

        Me gusta

  3. Anónimo dijo:

    Juan Carlos, me encantó la manera dictáctica de explicar el abc de la estadística. Espero con ansias el post de estadística inferencial =)

    Me gusta

  4. Pingback: Cerveza, estadística y la t-student | Estadística para todos, hecho por un psicólogo

  5. Pingback: ¡Es significativo! ¿Qué es eso? La estadística inferencial | Stats SOS

  6. Pingback: La vida después del ANOVA: el Post Hoc | Stats SOS

  7. Pingback: Tan parecidos que parecen relacionados: La t-student de muestras relacionadas | Stats SOS

  8. Pingback: Pero mira, ¡qué genial cómo interactúan! La interacción estadística | Stats SOS

  9. Pingback: Dos caminos, un destino: el ANOVA de dos vías | Stats SOS

  10. Pingback: No es paramétrico, ¿Y ahora? ¡Cómo comparo! La U de Mann-Whitney | Stats SOS

  11. Pingback: Gonzalo apoya la aditividad: Los 4 supuestos de la regresion lineal | Stats SOS

  12. Pingback: ¿Muestras no paramétricas relacionadas? La W-wilcoxon | Stats SOS

  13. Pingback: Mis grupos son diferentes ¿Cuán diferentes? El tamaño del efecto | Stats SOS

  14. María Paz dijo:

    En cual post explicas que es el valor p ? Resulta que para mi examen no puedo ser un robot y aceptar Ho si es mas grande de 0.05, tengo que explicar porque.

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s