Prácticas

 

============================================================================== 

curso 2016-2017

==============================================================================

=============================

EXAMEN JUNIO 2017:

ENUNCIADO

DATOS

=====================================

 Unidad 1: LaTeX, Sweave y Markdown

Unidad 2: statgrazer, reptools, dplyr, xtable, textreg, etc.

Unidad 3: glm(…,family= binomial, poisson, gaussian, Gamma, etc.)

 – Ejercicios GLM gaussiano

         – Leer los datos del ejemplo 2 de forma correcta:

         library(data.table)
         mydat <- fread('http://data.princeton.edu/wws509/datasets/salary.dat')
         head(mydat)

– > > Solución al ejercicio 1 (video 1, video 2) (Markdown)

–> > Solución al ejercicio 2 (video 1) (markdown)

–>> Solución al ejercicio 3

_______________

Práctica 1

_______________

Práctica que deberá entregarse antes del día 30 de abril de 2017

Enunciado

Datos

Puntualizaciones:

  •  Debes de entregar un informe : Introducción, Material y Métodos, Resultados y Resumen
  • Un anexo con las salidas de R que consideres oportunas.
  • El archivo Markdown con el que has generado el informe.

SOLUCIÓN PRÁCTICA 1: (practica 1)

______________________________

Competencia Transversal:

 

Creando un blog con Blogger desde GoUMH –>Mi Blog usando Blogger (vídeo)

Vídeo justificando la actividad: enlace (vídeo)

______________________________

Seminario Virtual:  

 

LA ESTADÍSTICA COMO HERRAMIENTA PARA EL ESPACIO SOCIAL Y BIENESTAR

(enlace)

Formulario de control de Visualización

(Responder el formulario antes del 15 de mayo de 20178)

______________________________

Ejercicio Regresión Logística:

(Pdf con ejemplo de gráficos)

Enunciado 1: pdf

Tenemos los datos de una encuesta a los visitantes a un Parque de Atracciones.

Los datos contienen la siguiente información:

  • Si es o no visitante de fin de semana (weekend),
  • Número de niños que le acompañan (num.cild),
  • La distancia desde su hogar al parque (distance).
  • Satisfacción general (overall),
  • Satisfacción con las atracciones(rides), juegos (games),tiempos de espera (wait) y limpieza (clean).

El cliente quiere saber si se puede o no predecir la potencialidad e los clientes de finde semana con los datos recogidos.

Datos:  sat.df <- read.csv(«http://goo.gl/HKnl74″)

—————————————

Buscando un punto de corte:

 

for(i in 1:6){  
 corte<-20+10*i
    sat.df$satisfecho<-factor(ifelse(sat.df$overall<corte,"NO","SI"))

## el comando que quieres que os haga para cada
## punto de corte
## sea gráfico o no
##########################
## 2 categóricas:
var1<-"weekend"
var2<-"satisfecho"
doubledecker(table(sat.df[,c(var1,var2)]),
             depvar ="satisfecho", keep_aspect_ratio=FALSE,
              main=paste("punto de corte:",corte ))
##########################
# 1 contínua y una categórica:
 p<-ggplot(sat.df, aes(x=satisfecho, y=games))+
 geom_boxplot()+
 labs(title=paste("Punto de corte:",corte))
 
 print(p)  
}

—————————————–

_______________

Práctica 2

_______________

Enunciado pdf

Datos Vinos: Tinto y blanco

AyudaSintaxis día 1 Sintaxis día 2

________________________________________

============================================================================== 

curso 2015-2016

============================================================================== 

Examen junio: Enunciado y datos

Examen septiembre: zip y datos (zip)

============================================================================== 

Entrega del Blog

============================================================================== 

 

Práctica 3: ANALIZANDO LAS REDES SOCIALES  (Fecha de entrega 31/05/2016)

============================================================================== 

Seminario On-Line

Un ejemplo real de Análisis Factorial: ¿Son las Universidades Públicas de «talla»  única? (Vídeo)

============================================================================== 

 

 

Seminario Virtual: 

LA ESTADÍSTICA COMO HERRAMIENTA PARA EL ESPACIO SOCIAL Y BIENESTAR

(enlace)

(Formulario de control de Visualización)

============================================================================== 

Práctica 2: Regresión logística, Árboles y Random Forest.  (Fecha de entrega 13/05/2016)

==============================================================================

============================================================================== 

Práctica 1: Descriptiva, Modelos Lineales.  (Fecha de entrega 31/03/2016)

Solución de la práctica: Solución

  • Enunciado:
    • Informe Descriptivo (gráfico y numérico)
    • Ajuste del modelo (Bondad de ajuste y Validación)
    • Responder a las preguntas del enunciado.

==============================================================================

 

__________________________________________________________

Sesión 5: Generando Informes con RStudio: Sweave (vídeo), Markdown (vídeo) & LaTeX.

—–>>  Estadística Descriptiva y Modelos Lineales

————>> Archivos Rmw y Rmd

———–>> Archivos PDF y Word generados desde RStudio

Sesión4 y 4b: Validación y Predicción de un Modelo Lineal–>    Cross-Validation en R (Texto sobre Qué es la validación cruzada)

—> Librería «dplyr»:  (Videotutoriales muy buenos) Part-1 ,  Part-2

Sesión 4 y 4b:  Modelos Lineales en la Investigación comercial –>

 —>>> Base de datos de clase: jack.jill.rda

—>> Practical Regression and Anova using R  (libro gratuito básico de modelos lineales)

——–>> más material sobre este libro

Sesión 2:  Creando un blog con Blogger desde GoUMH –>Mi Blog usando Blogger (vídeo)

Sesión 2: RStudio y la Reproducibilidad con R –> Creando documentos «bonitos» desde RStudio (víde0)

Sesión 2: Librerías importantes para el análisis multivariante en R –>sintaxis R_sesion2 (vídeo)

 

==================================================================

Plantilla para redactar informesPlantilla (Utilizar Goumh para identificarse).

===================================================================

 R, R-Commander y RStudio:

Material Complementario:

Repaso de R:

___________________======================================_____________________

 

 

___________________======================================_____________________

 

 Trabajos de años anteriores:

___________________======================================_____________________

Material de Cursos Anteriores

 

Sesión 10: Breve introducción al Big Data (twitter) (Enlace de Interés)

  • Práctica 2: Regresión Logística y Árboles de decisión  y Redes Neuronales:

           Enunciado: práctica 2 (fecha de entrega inamovible 10/06/2014)

Sesión 9: Redes Neuronales –> código R con el ejemplo de Clase: neuralnet.R y material en pdf sobre este tema Introduction_to_Neural_Networks with RFundamentals_of_Neural_Networks & neuralnet

Sesión 8R: Selección de variables «Importante» vía Random Forest para modelos logísticos y árboles: Sesion_8_codigo_R

Sesión 7c: Árboles de Decisión –> datos para trees (comparar Logistic vs Tree)

Sesión 7b: Árboles de Decisión –> sesion 14_1  y podando el árbol: sesion_14_2 (vídeo)

Sesión 6b: Regresión logística –> Sintaxis y RData (video) (Base da datos: HATCO)

Seminario:

CLASIFICACIÓN DE CONSUMIDORES ELÉCTRICOS CON REDES NEURONALES AUTOORGANIZADAS

Material complementario del seminario

 

Sesión 5c: Reducción de la dimensión (II) –> PCA. EFA (Cap. 10 «Statistics for Marketing and Consumer Research»  (Chap10 &  Trust)

………………………………………………………..–>http://consumer.stat.unibo.it/  site del libro

……………………………………………………….–> Páginas sobre los datos del libro en Google Books aquí

……………………………………………………….–> libreria psych (psych)

……………………………………………………….–>Dibujar de otra forma los resultados de un Análisis Factorial

Sesión 5 y 5b: Reducción de la Dimensión (I) –>  PCA(PCA.zip), EFA & CFA en R  (teim_sesion_09) (video

Lunes, 5 de junio de 2017