La vida es aquello que te va sucediendo mientras te empeñas en hacer otros planes.John Lennon
domingo, 13 de marzo de 2016
domingo, 6 de marzo de 2016
Tarea evaluable T3
Tarea evaluable T3
Unos investigadores desarrollan un nuevo entorno virtual de aprendizaje basado en Google Apps. Para evaluar la incidencia de la utilización de este nuevo entorno en las calificaciones de los estudiantes, durante dos años se realiza un estudio de caso con dos grupos de estudiantes: un grupo de control que utiliza Moodle y un grupo experimental que utiliza Google Apps; el reparto de sujetos entre ambos grupos se realiza siguiendo un criterio de paridad de sexo.
El registro del caso se recoge en el siguiente fichero: https://www.dropbox.com/s/d4egha6ag2hgt9i/Notas-2grupos-v3.csv?dl=0
SE PIDE:
1.
Observar los datos y reflexionar acerca
de la relación que existe entre las variables calificación, grupo y sexo.
2.
Dibujar en Excel o Google Sheets un
gráfico de interacción (http://courses.washington.edu/smartpsy/interactions.htm) de las medias de
las calificaciones combinando las variables grupo y sexo, es decir:
Moodle-Male, Moodle-Female, GoogleApps-Male, GoogleApps-Female. ¿Coinciden los
resultados mostrados en el gráfico con tus reflexiones del apartado
anterior?
3.
Analizar si existen diferencias
estadísticamente significativas en las calificaciones en función del grupo y
del sexo.
4.
Utilizar la función aov() de R para saber
si existe una interacción estadísticamente significativa entre las variables
grupo y sexo.
1. Observar los datos y
reflexionar acerca de la relación que existe entre las variables calificación,
grupo y sexo.
Figura 1.0 |
Abrimos
la interfaz R studio y cargamos el fichero de datos desde la cuadrícula
superior derecha: Import Dataset → From text file
Figura 1.1 |
A continuación se abre
una ventana en cuya parte derecha se muestra, por un lado, el contenido del
fichero de texto que deseamos cargar, y por otro lado, la estructura de datos
que se va a cargar en R a partir de dicho contenido según las opciones indicadas
en la parte izquierda de ventana. Para que la creación de la estructura de
datos se realice de forma correcta, debemos indicar a través de dichas opciones
si el contenido del fichero de datos incluye una cabecera, cuál es el separador
utilizado entre variables, cuál es el carácter utilizado para separar la parte
entera de la parte decimal de un número, etc.
Figura 1.2 |
Figura 1.3 |
Si el proceso se realiza correctamente, la estructura de datos debería
aparecer representada en una nueva cuadrícula. El entorno queda compuesto
de 4 cuadrículas: la cuadrícula superior derecha se utiliza para cargar datos y
visualizar las variables de trabajo; la cuadrícula superior izquierda se
utiliza para visualizar el contenido de dichas variables; la cuadrícula inferior
izquierda se utiliza para introducir los comandos para procesar y analizar los
datos; y la cuadrícula inferior derecha se utilizar para visualizar gráficas.
Figura 1.4 |
Los siguientes
pasos van dirigidos a la obtención de
los siguientes grupos de datos a partir del primer archivo: Moodle-Male,
Moodle-Female, GoogleApps-Male, GoogleApps-Female. En dicha figura se
diferenciarán, mediante distintos colores, los estudiantes entorno sexo
FILTRADO DE DATOS
Para filtrar los sujetos
por tipo entorno, escribimos los siguientes comandos en la consola:
grupoMoodle <- subset(Notas.2grupos.v3, grupo=="Moodle")
grupoGoogleApps <- subset(Notas.2grupos.v3, grupo=="Google Apps")
Al ejecutar estos comandos, se crearán dos nuevas variables: grupoMoodle y grupoGoogleApps.
Figura 1.5 |
Para filtrar los sujetos por tipo de entorno y sexo, escribimos los
siguientes comandos en la consola:
oodle-Male <- subset(grupoMoodle, sexo==”M”)
Moodle-Female <- subset(grupoMoodle,
sexo==”F”)
GoogleAppMale <- subset(grupoGoogleApps,
sexo=="M")
GoogleappsFemale <-
subset(grupoGoogleApps, sexo=="F")
Al ejecutar estos comandos, se crearán cuatro nuevas variables: oodle-Male, Moodle-Female, GoogleAppMale
y GoogleappsFemale.
Figura 1.6 |
En este punto tenemos la división por sexo, grupo y
calificaciones al mismo tiempo.
ANÁLISIS REFLEXIVO
Observando detenidamente cada
grupo ordenados o agrupados de la siguiente manera ( Moodle.Male, Moodle.Female, GoogleApp.Male
y Googleapps.Female) podemos
visualizar a simple vista que no existe ninguna relación aparentemente
significativa, ya que las notas en la mayoría de casos guardan similitudes en
ambos grupos tomando en cuenta el sexo, como lo hemos hecho en este caso.
2. Dibujar
en Excel o Google Sheets un gráfico de interacción (http://courses.washington.edu/smartpsy/interactions.htm) de las medias de las calificaciones
combinando las variables grupo y sexo, es decir: Moodle-Male, Moodle-Female,
GoogleApps-Male, GoogleApps-Female. ¿Coinciden los resultados mostrados en el
gráfico con tus reflexiones del apartado anterior?
Creamos los grupos GrupoMoodle y GrupoGoogleApps
Con los siguientes códigos:
GrupoMoodle
<- subset(Notas.2grupos.v3, grupo =="Moodle")
GrupoGoogleApps
<- subset(Notas.2grupos.v3, grupo =="Google Apps")
Figura 2.0 |
Luego agrupamos por sexo cada grupo con
los siguientes códigos
GoogleApps.Male <- subset(GrupoGoogleApps, sexo
=="M")
GoogleApps.Female <- subset(GrupoGoogleApps,
sexo =="F")
Y
Moodle.Male <- subset(GrupoMoodle, sexo
=="M")
Moodel.Female <- subset(GrupoMoodle, sexo
=="F")
Figura 2.1 |
ANÁLISIS DE DATOS.
En primer lugar, debemos de obtener los valores del análisis en cada categoría para luego realizar nuestros gráficos de interacción.
En primer lugar, debemos de obtener los valores del análisis en cada categoría para luego realizar nuestros gráficos de interacción.
Primero buscaremos los datos
estadísticos, tomando en cuenta la calificación o nota por grupo y por sexo con
la siguiente línea de códigos:
t.test(grupoGoogleApps$nota, grupoMoodle$nota)
RESULTADOS
Análisis de datos por grupo
(GrupoGoogleApps vs GrupoMoodle)
Figura 2.2 |
ANÁLISIS DE DATOS POR SEXO
Moodle.Female$nota vs GoogleApps.Female$nota
Figura 2.3 |
Figura 2.4 |
Veamos algunos gráficos de interacción de los datos de las figuras 2.2, 2.3 y 2.4.
GoogleApps
|
Moodle
|
7.25
|
5.25
|
Moodle.Female
|
GoogleApps.Female
|
5.9
|
6.6
|
|
3. Analizar si existen diferencias estadísticamente significativas en las calificaciones en función del grupo y del sexo.
- Haciendo referencia a la figura 2.2 la cual analiza en función de los grupos Moodle y Google Apps, donde tenemos una media en x=7.25 y=5.25 y un p-value = 1.683e-06 encontramos que se encuentra muy por encima del margen de error de 5%.
- La figura 2.3 nos referencia en el análisis de Moodle.Female y GoogleApps.Female donde obtuvimos un media de x=5.9 y=6.6 y un p-value = 0.1069 para un 10% de margen de error.
- Para la figura 2.4 tenemos la siguiente media x=4.6 y=7.9 con un p-value=2.603 para un margen de error muy alto.
De los tres casos anteriores podemos sacar las siguientes conclusiones:
Existe un margen de error muy grande al afirmar que es debido al azar y no al factor diferencial del grupo.
Que los estudiantes con la media mas alta corresponden a los Google App.
Que los estudiantes con la media mas alta corresponden a los Google App.
4. Utilizar la función aov() de R para saber si existe una interacción estadísticamente significativa entre las variables grupo y sexo.
resultados.aov <- aov(nota~(grupo*sexo), data =Notas.2grupos.v3)
> summary(resultados.aov)
Df Sum Sq Mean Sq F value Pr(>F)
grupo 1 40.0 40.00 47.06 5.02e-08 ***
sexo 1 0.0 0.00 0.00 1
grupo:sexo 1 16.9 16.90 19.88 7.74e-05 ***
Residuals 36 30.6 0.85
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Gráfico de Interacción de regresión lineal utilizando
interaction.plot(grupo, sexo, nota)
interaction.plot(grupo, sexo, nota)
Figura 2.6 |
Pr(>F) 7.74e-05, representa un 0,0077399999999999995 % (0.0078%), valor por debajo del 5%.
entonces concluimos que sí existe, una interacción significativa entre las variables grupo sexo.
Fuentes Bibliográficas
http://www.mutae.net/2016/01/bt01-bt02-actividad-9-introduccion-r.html
http://www.uv.es/mperea/R-Anovas.html
https://cran.r-project.org/doc/contrib/R-intro-1.1.0-espanol.1.pdf
https://cran.r-project.org/doc/contrib/curso-R.Diaz-Uriarte.pdf
Tarea evaluable T2
Situación
Unos investigadores desarrollan un nuevo entorno virtual
de aprendizaje basado en Google Apps. Para evaluar la incidencia de la
utilización de este nuevo entorno en las calificaciones de los estudiantes,
durante dos años se realiza un estudio de caso con dos grupos de estudiantes:
un grupo de control que utiliza Moodle y un grupo experimental que utiliza
Google Apps.
Que se pide
Para cada uno de los años, analizar si existen
diferencias estadísticamente significativas entre las calificaciones de ambos
grupos.
- Año 1: https://www.dropbox.com/s/mz6ezs68i05bimz/Notas-2grupos-v1.csv?dl=0
- Año 2: https://www.dropbox.com/s/vc2lht7wqtshq5p/Notas-2grupos-v2.csv?dl=0
CARGAR DATOS
Cargar segundo archivo
NOTA
EL SEGUNDO ARCHIVO ESTA DIVIDIDO
POR SIGNO DE # POR LO QUE COPIAMOS EL CODIGO DE LA RUTA Y EN SEP AGREGAMOS EL
SIGNO UTILIZADO EN ESTE ARCHIVO, de lo contrario nos dará error.
Notas.2grupos.v2 <- read.delim("C:/Users/pc/Desktop/TAREA OSKAR2/Notas-2grupos-v2.csv", sep = "#")
Figura 1.0 |
ANALIZAREMOS SI EXISTE DIFERENCIAS ESTADÍSTICAMENTE
SIGNIFICATIVAS ENTRE LAS CALIFICACIONES DE AMBOS GRUPOS, POR AÑOS.
Despejamos las variables que vamos a utilizar
Primer año
> datosMoodleaños1 <- subset(Notas.2grupos.v1, grupo =="Moodle")
> datosGoogleappsaños1 <- subset(Notas.2grupos.v1, grupo =="Google Apps")
Figura 1.2 |
Segundo año
> datosMoodleaño2 <- subset(Notas.2grupos.v2, grupo =="Moodle")
> datosGoogleappsaños2 <- subset(Notas.2grupos.v2, grupo =="Google Apps")
figura 1.3 |
Ejecutamos el t.test
Comparando de la siguiente manera
GRUPO
AÑO 1
|
GRUPO
AÑO 2
|
datosMoodleaños1---------->
|
datosMoodleaño2
|
datosGoogleappsaños1----à
|
datosGoogleappsaños2
|
Media de las notas de los estudiantes que utilizaron Moodle año 1 y Moodle año 2.
Figura 1.4 |
¿Qué nos indican
los resultados?
En primer lugar, que la
media de la variable x (datosMoodleaño1$nota) es de 6.25, mientras que la variable y (datosMoodleaño2$nota) tiene una
media de 6.55, para
una diferencia de -0.3 Por tanto, como hemos dicho anteriormente, la
diferencia entre ambos grupos no parece significativa porque es tan sólo de -0.3.
¿Es esta diferencia
ESTADÍSTICAMENTE significativa? Es decir, ¿la diferencia se debe al factor diferencial
entre ambos grupos o se debe al azar? Para saberlo, nos fijamos en el p-value.
¿Qué indica el p-value? Indica que el
riesgo a equivocarnos al afirmar "Si, existe una diferencia
estadísticamente significativa entre ambos grupos debida al factor diferencial
entre dichos grupos", cuando en realidad dicha diferencia no se debe al
factor diferencial entre grupos, sino al azar. En este caso, p-value = 0.4577
= 45% ose, un error muy grande de equivocarnos.
Figura 1.5 |
Como vemos, en lo que respecta a la calificación final, el riesgo que corremos al afirmar "Sí, existe una diferencia estadísticamente significativa entre ambos grupos determinada por la plataforma utilizada en cada grupo" es grande.
Media de las notas de los estudiantes que utilizaron Google Apps año 1 y Google Apps año 2.
Figura 1.6 |
¿Qué nos indican
los resultados?
Podemos observas que
los estudiantes que utilizaron google apps, tanto el primer año como el segundo
no reflejaron ninguna a diferencia estadísticamente hablando debido a que la media obtenida son iguales tanto para x(7.25) como para y(7.25) y nuestro margen
de error p-value = 1
Figura 1.7 |
p-value en estadística
¿Qué es un valor p?
Utilice el valor p para determinar si los
resultados son estadísticamente significativos. Los valores p suelen utilizarse
en las pruebas de hipótesis, donde usted rechaza o no puede rechazar una
hipótesis nula.
Cuando usted realiza una prueba de hipótesis, el
elemento clave de la salida en el que hay que concentrarse es el valor p.
Un valor p oscila entre 0 y 1. El valor p
es una probabilidad que mide la evidencia en contra de la hipótesis nula. Las
probabilidades más bajas proporcionan una evidencia más fuerte en contra de la
hipótesis nula.
Puede comparar el valor p con el nivel de
significancia (α) para decidir si debe rechazar la hipótesis nula (H0).
Si el valor p es menor que o igual a α,
rechace H0.
Si el valor p es mayor que el nivel de
significancia (α), usted no puede rechazar H0.
Para el nivel de significancia (α) suele utilizarse
un valor de 0.05, entonces, si el valor p es menor que o igual a 0.05,
rechace H0.
Ahora analizaremos los datos de la siguiente manera
Veremos si existe alguna diferencia estadística cuando los
estudiantes en un año utilizaron
Moodle un año y Google Apps otro año.
Moodle año 1 vs Google Apps año 2 y Google Apps año 1 vs Moodle año 2
Moodle un año y Google Apps otro año.
Moodle año 1 vs Google Apps año 2 y Google Apps año 1 vs Moodle año 2
GRUPO
AÑO 1
|
GRUPO
AÑO 2
|
datosMoodleaños1------------------>
|
datosGoogleappsaños2
|
datosGoogleappsaños1--------------->
|
datosMoodleaño2
|
t.test(datosMoodleaños1$nota, datosGoogleappsaños2$nota)
Figura 1.8 |
¿Qué nos indican
los resultados?
para los estudiantes que el primer año utilizaron Moodle y el siguiente año Google Apps En lo concerniente a la media x (6.25) y (7.25), podemos observar que existe un crecimiento en la nota de los estudiantes. de una diferencia de 1.
el p-value =0.007427, nos dice que tenemos un margen de equivocarnos sí afirmamos que esto se debió al alzar de 0,07%, en pocas palabras sí podemos afirmar que se debió al azar, puesto que se encuentra por debajo del 5%.
Figura 1.9
t.test(datosGoogleappsaños1$nota, datosMoodleaño2$nota)
¿Qué nos indican
los resultados?
Para el caso de los estudiantes que utilizaron el primer año Google Apps y el segundo año Cambiaron a Moodle tenemos una media de x(7.25) mientas que para y(6.55) con una disminución de la nota al pasar de Google Apps a Moodle. nuestro p-value =0.08832 para un 8,831999999999999 %, concluyendo que no se debió al azar sino, a la diferencia de grupo.
Conclusiones
Podemos concluir diciendo que las calificaciones varían para mejoría, utilizando el entorno Google Apps, pero esto no representa una diferencia estadística significativa.
En el caso de la figura 1.6 donde la media en ambos casos tienen un valor de 7.25, del análisis de Google Apps año 1 y Google App año 2, podemos decir que no se figura variación en las notas.
Fuentes Bibliográficas
http://www.mutae.net/2016/01/bt01-bt02-actividad-9-introduccion-r.html
https://cran.r-project.org/doc/contrib/rdebuts_es.pdf
En el caso de la figura 1.6 donde la media en ambos casos tienen un valor de 7.25, del análisis de Google Apps año 1 y Google App año 2, podemos decir que no se figura variación en las notas.
Fuentes Bibliográficas
http://www.mutae.net/2016/01/bt01-bt02-actividad-9-introduccion-r.html
https://cran.r-project.org/doc/contrib/rdebuts_es.pdf
Suscribirse a:
Entradas (Atom)