[RDS] Ejercicios resueltos para la sección 5.2.4

Esta semana no va a centrarse tanto en la serie [RDS] como la anterior, pero su pequeña dosis al menos sí que la va a tener. Empezamos con el quinto capítulo, que explora la maravillosa librería dplyr. En el siguiente R Notebook están disponibles las soluciones para los ejercicios propuestos asociados al verbo filter.

Leer más “[RDS] Ejercicios resueltos para la sección 5.2.4”

[RDS] Ejercicios resueltos para la sección 3.7.1

Esta semana ha sido un tanto monotemática, con casi todos los posts dedicados a las soluciones de diferentes secciones de “R for Data Science“. Cambiaremos de tercio un poco la que viene, que ya espero tener unas animaciones en R para entonces (crucemos los dedos).

Mientras tanto, anuncio que, por fin, ya está completo el documento correspondiente a los ejercicios del tercer capítulo, y lo podéis consultar a través del siguiente enlace:

Leer más “[RDS] Ejercicios resueltos para la sección 3.7.1”

[RDS] Ejercicios resueltos para las secciones 3.8.1 y 3.9.1

Mientras continúo mi relación de amor y odio asociada a los ejercicios de la sección 3.7.1, dejo por aquí las soluciones correspondientes a los dos apartados que figuran tras la mencionada: 3.8.1 y 3.9.1. El primero de ellos se ocupa del posicionamiento de los elementos geométricos, mientras que el segundo se centra en estudiar diversos sistemas de coordenadas.

Leer más “[RDS] Ejercicios resueltos para las secciones 3.8.1 y 3.9.1”

[RDS] Ejercicios resueltos para la sección 4.4

prog-languages

Entre el traslado de esta serie a R Notebooks en GitHub, y tener que esperar a que ciertas librerías se actualizasen para completar unos ejercicios del capítulo anterior, han tardado en llegar novedades un poco más de lo que me hubiese gustado.

Leer más “[RDS] Ejercicios resueltos para la sección 4.4”

[RDS] Ejercicios resueltos para la sección 3.6.1

Continuamos con la serie de ejercicios resueltos para el weblibro “R for Data Science“, al que podéis acceder desde este enlace. En esta ocasión nos ocuparemos de la sección 3.6.1, correspondiente a los problemas que se ocupan de dar a conocer algunos de los diferentes elementos geométricos que la librería ggplot2 pone a nuestra disposición (los famosos geoms).

# 1. What geom would you use to draw a line chart?
#    A boxplot?
#    A histogram?
#    An area chart?

library(tidyverse)

?geom_line
?geom_boxplot
?geom_histogram
?geom_area

No podemos más que reconocer que la elección de nombres para los distintos elementos geométricos que incorpora este paquete es bastante intuitiva. Si tenemos cierta sospecha sobre cómo se denomina el gráfico (en inglés, por supuesto) que estamos interesados en generar, seguramente tengamos que añadir la palabra correspondiente tras geom_ para tener acceso a él.

Leer más “[RDS] Ejercicios resueltos para la sección 3.6.1”

[RDS] Ejercicios resueltos para la sección 3.5.1

Nueva entrega de la serie de ejercicios resueltos para el weblibro “R for Data Science“, al que podéis acceder desde este enlace. En esta ocasión nos ocuparemos de la sección 3.5.1, correspondiente a los problemas que tratan de asentar la división de los puntos de un gráfico en diferentes imágenes, en función de cierta categoría a la que pertenezcan (los famosos facets).

# 1. What happens if you facet on a continuous variable?

library(tidyverse)
ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy)) +
    facet_wrap(~ cty, nrow = 3)

ej-3-5-1-1-1

Generalmente, los facets se utilizan con variables categóricas, ya que generaremos un gráfico por cada una de sus clases. Al emplear una variable cuantitativa, la imagen resultante pierde parte de su sentido, ya que hemos creado tantos diagramas como valores distintos posee dicha variable.

Podría ser útil si nuestro objetivo es examinar la existencia de tendencias para ciertos valores particulares de una variable cuantitativa, aunque quizá en tal caso sería más recomendable que directamente generásemos los gráficos de interés, en lugar de esta ristra de diagramas.

Veamos un par de ejemplos adicionales:

ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy)) +
    facet_wrap(~ displ, nrow = 4)

ej-3-5-1-1-2

ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy)) +
    facet_wrap(~ hwy, nrow = 4)

ej-3-5-1-1-3

Leer más “[RDS] Ejercicios resueltos para la sección 3.5.1”

[RDS] Ejercicios resueltos para la sección 3.3.1

Continuamos con la serie de ejercicios resueltos para el weblibro “R for Data Science“, al que podéis acceder desde este enlace. En esta ocasión nos ocuparemos de la sección 3.3.1, correspondiente a los problemas que tratan de asentar el manejo de los elementos estéticos a la hora de generar gráficos con la función ggplot().

# 1. What’s gone wrong with this code?
#    Why are the points not blue?

library(tidyverse)
ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy, color = "blue"))

Si ejecutamos el anterior bloque de instrucciones, esta es la imagen que aparece en pantalla:

ej-3-3-1-1-1

El argumento color = "blue" no debe colocarse dentro de la función aes() si pretendemos que afecte a todos los puntos, sino fuera de ella. En su interior lo podemos utilizar si, por ejemplo, deseamos que el color de los puntos se establezca dependiendo del valor que tome cierta variable (y en lugar de emplear “blue”, escribiríamos el respectivo nombre de dicha variable).

Así pues, para solucionar el problema simplemente tendríamos que escribir:

ggplot(data = mpg) +
    geom_point(mapping = aes(x = displ, y = hwy), color = "blue")

ej-3-3-1-1-2

Leer más “[RDS] Ejercicios resueltos para la sección 3.3.1”