Bases metodológicas de la investigación educativa

Tabla de contenidos



INTRODUCCION

CONTENIDOS ACTIVIDADES

PRACTICA 3

 

Diferencia de medias

 

 

INTRODUCCION

 

Una vez revisados los principales métodos que dispone el SPSS para los análisis univariantes, en esta práctica vamos a mostrar los dos procedimientos que se utilizan para los análisis de submuestras obtenidas a partir de una muestra global.

·         1.- El procedimiento MEDIAS permite la descripción de variables en las diferentes submuestras que pueden ser generadas a partir de la muestra.

·         2.- El procedimiento PRUEBA-T calcula el estadístico t de Student para comprobar la significación de una diferencia de medias para dos muestras independientes o relacionadas, así como para la comparación de una sola muestra con un valor hipotético.

 

CONTENIDOS

I. DESCRIPCIÓN DE LAS VARIABLES EN LAS DISTINTAS SUBMUESTRAS

 

I.1. Objetivos

Estos procedimientos nos permiten describir las diferentes submuestras dentro de una muestra global.

 

I.2. Procedimientos

El procedimiento MEDIAS sirve para calcular medias de subgrupo y estadísticos univariados relacionados para variables dependientes, fundamentalmente cuantitativas [1], dentro de las categorías de una o más variables independientes.

 

Los diferentes subgrupos o submuestras son generados a partir de criterios de clasificación, normalmente apoyados en variables cualitativas de corte, o a partir de variables cuantitativas que previamente, y mediante el uso del procedimiento RECODIFICAR, hemos tenido que transformar.

 

Veamos algún ejemplo:

 

Supongamos que nos interesa conocer la Madurez Intelectual media de nuestros 8 grupos de alumnos. Desde el menú de Análisis seleccione la opción Compara Medias y después el procedimiento MEDIAS. Este procedimiento calcula los estadísticos descriptivos del siguiente modo:

 

 

 

 

Como era de esperar, los grupos de 5º obtienen, en general, un rendimiento medio superior al de los alumnos de 4º.

 

El procedimiento Medias permite también especificar otra variable de corte. Así, vamos a describir la Madurez Intelectual de cada uno de los grupos de tratamiento de los alumnos de 5, diferenciando a su vez entre alumnos de Inteligencia General Verbal baja, media y alta. Para ello, en el cuadro de diálogo de Compara Medias es necesario añadir la segunda variable independiente o de corte; en nuestro caso la variable Inteligencia General Verbal. Esta variable ha tenido que recodificarse para transformarla en una variable politómica de las siguientes tres categorías de clasificación:

·         1 Inteligencia Verbal Baja que comprende valores inferiores a 59 (Percentil 25)

·         2 Inteligencia Verbal Media que comprende valores desde 60 a 74.

·         3 Inteligencia Verbal Alta que comprende los valores superiores a 75 (Percentil 75)

 

Cada capa subdivide consecutivamente la muestra. Como en este caso hemos introducido una variable independiente en Capa 1 (grupo) y otra en Capa 2 (IVerbal),los resultados aparecerán en una tabla cruzada.

 

 

En el mismo cuadro de diálogo, el botón OPCIONES permite calcular toda una serie de estadísticos descriptivos, incluyendo el análisis de varianza simple junto con la prueba de homogeneidad de varianzas de Levene. El análisis de varianza muestra su tabla correspondiente y además calcula como índices de intensidad de la relación entre variable dependiente y variable independiente h y h 2 (*) . El test de linealidad calcula las sumas de cuadrados, grados de libertad y cuadrado medio asociados a los componentes lineal y no lineal. Además calcula el estadístico F, la r de Pearson y la r 2

 

El resultado para nuestras variables sería el siguiente:

 

 

II. DIFERENCIA DE MEDIAS

II.1. Objetivos

El submenú Comparar Medias del menú Análisis proporciona tres tipos de pruebas t:

1.       Prueba T para muestras independientes (prueba T para dos muestras). Compara las medias de una variable para dos grupos de casos. Calcula estadísticos descriptivos para cada grupo además de la prueba de Levene para la igualdad de varianzas, así como los valores de t para varianzas iguales y desiguales y el intervalo de confianza del 95% para la diferencia de medias.

2.       Prueba T para muestras relacionadas (prueba T dependiente). Compara las medias de dos variables en un solo grupo. Esta prueba también se utiliza para pares relacionados. El resultado incluye estadísticos descriptivos de las variables que se van a contrastar, la correlación entre ellas, estadísticos descriptivos de las diferencias emparejadas, la prueba t y el intervalo de confianza del 95%.

3.       Prueba T para una muestra. Compara la media de una variable con un valor conocido o hipotetizado. Se muestran estadísticos descriptivos para las variables de contraste junto con la prueba t. Por defecto, el SPSS incluye el intervalo de confianza del 95% para la diferencia entre la media de la variable de contraste y el valor hipotetizado de la prueba.

 

II.2. Procedimientos

 

La Prueba T es un procedimiento de carácter inferencial que nos permitirá efectuar un contraste de hipótesis para la diferencia de medias. Está basado en el modelo teórico de distribución t de Student.

 

Para aplicar correctamente este análisis debemos tener en cuenta si los datos proceden de muestras independientes o relacionadas (donde para cada sujeto hay un par correspondiente en el otro grupo). Esto es especialmente importante pues el estadístico de contraste es diferente (en el caso de muestras relacionadas el término de error disminuye considerablemente). Esta distinción es fundamental cuando queramos calcular diferencias entregrupos (transversales) o intragrupo (longitudinales).

 

II.2.1 Prueba T para muestras independientes

 

El contraste de hipótesis para muestras independientes divide los casos en dos grupos y compara las medias de los grupos respecto a una variable. En una situación ideal los sujetos deberían asignarse aleatoriamente a los grupos, de forma que cualquier diferencia pueda atribuirse al efecto del tratamiento y no a otros factores. Dicho de otro modo, debe asegurarse que las diferencias en otros factores no enmascaren o resalten una diferencia significativa entre las medias.

 

El procedimiento utiliza una variable de agrupación con dos valores para separar los casos en dos grupos. Esta variable de agrupación puede ser numérica o de cadena corta (como y no ). Pero también permite utilizar una variable continua, como la edad, para dividir los casos en dos grupos especificando un punto de corte (poe ejemplo 18 años divide la edad en el grupo de mayores de 18 y el de menores).

 

 

El SPSS permite introducir más de una variable de contraste y calcula una prueba T para cada variable. En cambio la variable de agrupación solamente puede ser una, y requiere definir los grupos que se desee comparar.

 

 

 

Los grupos de la variable de agrupación se pueden definir de dos formas:

 

1.      Usando valores especificados; se escribe un valor para el Grupo 1 y otro para el Grupo 2, quedando los casos con otros valores excluidos del análisis

2.      Con un punto de corte; se establece un número que divida los valores de la variable de agrupación en dos partes. Los casos con valores menores que el punto de corte forman un grupo y los casos con valores mayores o iguales que el punto de corte forman el otro grupo.

 

En nuestro caso hemos utilizado como punto de corte el valor 6 para dividir los grupos de tratamiento por curso. Así los alumnos de 5º formarán un grupo y los de 4º otro.

 

Los resultados figuran a continuación

 

Estadísticos descriptivos de los grupos

 

Contraste de hipótesis para la diferencia de medias

 

Antes de analizar los resultados del contraste de la diferencia de medias, es conveniente detenerse a valorar la comparación de las varianzas de ambos grupos (basándose en el estadístico F de Snedecor) [2]. Si se acepta la hipótesis alternativa (las varianzas no son iguales) el análisis más correcto de la t de Student es el que aparece en el apartadocorrespondiente a varianzas No iguales. El valor de t, los grados de libertad, y su probabilidad asociada aparecerán en pantalla bajo ese rótulo .

 

En el caso de que se acepte la hipótesis nula de igualdad de varianzas, se emplea otro estadístico basado en la distribución t, y básicamente igual al anterior, que presupone que las varianzas poblacionales de los dos grupos son iguales.

 

Para muestras grandes la diferencia entre ambos métodos es muy pequeña. En general, es recomendable usar el contraste de hipótesis de varianzas separadas, pues es un procedimiento más conservador [3].

 

Este procedimiento, por defecto, calcula la probabilidad de que el valor de t  en un contraste bilateral (significación bilateral) ocurra al azar. Si trabajamos con una hipótesis unidireccional, sólo es necesario dividir entre dos la probabilidad asociada de t. En ambos casos, si nuestro nivel a ( previamente establecido ) es menor, no podemos aceptar la hipótesis alternativa que plantea que la diferencia entre las dos medias es, estadísticamente, significativa.

 

II.2.2 Prueba T para muestras relacionadas

 

La Prueba T para muestras relacionadas compara las medias de dos variables de un solo grupo. Calcula las diferencias entre los valores de las dos variables y contrasta si la media difiere de cero. Es decir, este diseño se aplica cuando los datos están apareados o emparejados (provienen de sujetos con variables medidas antes y después del tratamiento o de pares de sujetos emparejados a partir de sus características similares en variables de control o que se desean controlar de modo específico).

 

Para realizar un contraste de hipótesis de muestras relacionadas se requieren, al menos, dos variables, que representen valores para los dos miembros del par, por ejemplo medidas pre-test y post-test. Sólo se pueden utilizar variables numéricas.

 

En nuestro caso, puede resultar muy útil la comparación de las situaciones pretest y postest para cada variable en cada grupo de tratamiento. Veamos un ejemplo:

 

 

 

Como se observa en el cuadro de diálogo, el programa permite introducir todos lo pares de variables que se deseen comparar. Seleccionando las variables FDPre y FDPost1 obtenemos los siguientes resultados:

 

 

 

En primer lugar aparecen los estadísticos propios del análisis. En la parte inferior figuran la diferencia de medias, la desviación típica de las diferencias y el error típico de la diferencia de medias. A continuación, aparecen los resultados propios del análisis de la t de Student: la t muestral, los grados de libertad y la probabilidad asociada a la t muestral. Para el caso de hipótesis unidireccionales debemos dividir esta probabilidad entre dos.

 

Como puede apreciarse en los figuras de resultados el SPSS tambien calcula el coeficiente de correlación entre las dos variables y la significación del mismo.

 

 

II.2.3 Prueba T para una muestra

 

El procedimiento Prueba T para una muestra contrasta si la media de una sola variable difiere de una constate especificada. Es decir, se emplea en situaciones en las que se pretende contrastar la diferencia entre la media de una muestra y la de su población de origen. Así podemos saber si una determinada muestra procede de una población cuya media verdadera se conoce. También este procedimiento puede ser muy útil, por ejemplo, para calcular la significación de las diferencias obtenidas por una muestra de sujetos en determinados tests psicológicos y los valores medios de los baremos, tomados como valores poblacionales.

 

Así por ejemplo, podría ser interesante para nuestro estudio comprobar si la madurez intelectual de un grupo de alumnos difiere del valor medio poblacional (supuestamente 100).

 

El procedimiento, tan sólo, requiere elegir una variable cuantitativa e introducir el valor de contraste hipotetizado, tal y como aparece en el siguiente cuadro de diálogo.

 

 

El resultado obtenido parece poner de manifiesto que la madurez intelectual de los alumnos de 5º es significativamente superior a la media poblacional.

 

 

 

 

ACTIVIDADES

 

A partir de la lectura del artículo de investigación Un nuevo modo de proceder en el aula aprendiendo mediante el ordenador (Reparaz y Tourón, 1992), realice los ejercicios necesarios para responder a las siguientes cuestiones:

 

1.- ¿Qué grupo de 5º alcanza el rendimiento medio en la variable SMDPost1 más elevado?

 

RESULTADOS:

 

2.- ¿Existen diferencias significativas en entre dichos rendimientos medios de los grupos de tratamiento de 5º? Es preciso recordar que para responder a esta cuestión con el Procedimiento Comparar Medias, tan sólo podemos comparar los grupos de dos en dos (como veremos más adelante el Análisis de Varianza es la prueba que debería aplicarse en este caso). Como se trata de muestras independientes, elegimos el procedimiento Prueba T para muestras independientes.

 

RESULTADOS:

 

Entre el Grupo 1 y el grupo 2 no existen diferencias significativas, mientras que entre el Grupo1 y el 4 sí que existen.

 

 

Este mismo análisis se podría repertir para cada comparación de dos grupos.

 

3.- ¿Qué tratamiento ha sido el más eficaz? Para contestar a esta pregunta será preciso calcular los rendimientos medios en cada grupo antes y después de recibir los tratamientos y comparar los incrementos de rendimiento respectivos. La respuesta a través del procedimiento Comparar Medias exige comparar para cada grupo la variable SMDPre con SMDPost1 mediante la Prueba T para muestras relacionadas. Veamos un ejemplo

RESULTADOS:

 

Prueba T

 

Prueba T

 

Tanto en el Grupo 1 (N=30) como en el 4 (N=37) existen diferencias significativas, a pesar de que la diferencia en el segundo grupo es mucho mayor (17,97 puntos).

 

4.- Podría calcular en qué grupo 5º o 4º de EGB los alumnos alcanzan el mejor rendimiento medio en la variable SMDPost1

RESULTADOS:

 

 

5.- ¿Los alumnos del Grupo 4 mantienen el nivel de aprendizaje del SMD a lo largo del tiempo? Para responder a esta cuestión necesita comparar los rendimientos medios de los diferentes postests.

RESULTADOS:

 

 

 

 



[1] El procedimiento TABLAS DE CONTINGENCIA se ocupa, como aparece en la Práctica 2, de las medidas de asociación entre variables cualitativas.

(*) Este valor multiplicado por 100 indica la varianza compartida entre la Vi y la VD, y dentro del diseño experimental supuesta la validez interna del mismo dicha varianza sería explicada (debida a).

[2] El estadístico t de Student, estrictamente, sólo puede aplicarse en muestras que proceden de poblaciones cuyas varianzas, conocidas, son iguales. En cualquier otro caso es necesario introducir en la fórmula algún término de corrección.

Si las varianzas son iguales, estadísticamente hablando,  la fórmula que se aplica es:

 , donde , mientras que para varianzas diferentes,

 

[3]Más conservador significa que reduce la probabilidad de cometer errores de tipo I.