8 Ejercicios

8.1 Parte 1

Cargar las variables almacenadas en el siguiente archivo Rdata

1. Calcula los valores numéricos aproximados de

  1. \(\frac{0.3 \cdot 0.15}{0.3 \cdot 0.15 + 0.2 \cdot 0.8 + 0.5 \cdot 0.12}\)
  2. \(\frac{5^6}{6!} e^{-5}\)
  3. \(\begin{pmatrix} 20 \\ 7 \end{pmatrix} 0.4^7 0.6^{13}\)

2. Realizar la siguiente suma

  1. \(1+2+3+...+1000\)
  2. \(1+2+4+8+16+...+1024\)

3. El vector grupo representa el grupo al que pertenece una serie de alumnos

  1. ¿Cuántos elementos tiene?
  2. ¿En qué posiciones del vector está la letra “A?”

4. El vector nota representa la nota de un examen de los alumnos que están en los grupos del vector grupo.

  1. ¿Cuanto suman todas las notas?
  2. ¿Cual es la media aritmética de todas las notas?
  3. ¿En qué posiciones están las notas mayores de 7.0?
  4. Visualiza las notas ordenadas de mayor a menor
  5. ¿En qué posición está la nota máxima?

5. A partir de los vectores grupo y nota definidos.

  1. Suma las notas de los 10 primeros alumnos del vector
  2. ¿Cuántos alumnos hay del grupo C?
  3. ¿Cuántos alumnos han aprobado?
  4. ¿Cuántos alumnos del grupo B han aprobado?
  5. ¿Qué porcentaje de alumnos del grupo C han aprobado?
  6. ¿De qué grupos son la máxima y mínima notas de toda la muestra?
  7. Nota media de los alumnos de grupo A y B, juntos, considerando sólo a los que han aprobado.

6. Calcula el percentil 66 de las notas de todos los alumnos, y también de los alumnos del grupo C.

7. Un alumno tiene una nota de 4.9. ¿Qué porcentaje, del total de alumnos, tiene una nota menor o igual que la suya? ¿Y qué porcentaje tiene una nota mayor o igual que la suya?

8. Realiza el gráfico de diagramas de caja de las notas de cada grupo, para poder comparar el nivel de cada uno de ellos.

9. Si la variable conc recoge la concentración de plomo (en ppm) en el aire de cierta zona durante un día completo

  1. ¿Cuál ha sido la concentración máxima?
  2. ¿En cuántos de los muestreos se ha superado la concentración de 40.0 ppm?
  3. ¿Cuál ha sido la concentración media del día?
  4. ¿Cuáles fueron las 10 mediciones más bajas del día?
  5. Si la primera medida fue a las 00:00. ¿A qué hora del día se alcanzó la concentración máxima?

8.2 Parte 2

1. 1.Graficar los puntos \((1,1),(2,4),(3,6),(4,8),(5,25),(6,36),(7,49),(8,61),(9,81),(10,100)\) en un plano utilizando RStudio.

2. Ingresar la matriz A en RStudio \(A = \begin{pmatrix} 1 & 2 & 3 \\ 2 & 4 & 6 \\ 3 & 6 & 9 \\ 4 & 8 & 12 \end{pmatrix}\)

3. Ingresar la matriz identidad de tamaño 3 \(I = \begin{pmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{pmatrix}\)

4. Crea una función que cree una matriz nula ingresando las dimensiones

5. Modificar la matriz diag(4), para que se parezca a la matriz B \(B = \begin{pmatrix} 0 & 0 & 0 & 0 \\ 0 & 2 & 0 & 0 \\ 0 & 0 & 3 & 0 \\ 0 & 0 & 0 & 4 \end{pmatrix}\)

6. Obtener la matriz transpuesta de A (ejercicio 2)

7. Realizar las siguientes operaciones \(A + B\), \(A - B\), \(3B\) y \(AB\)

8. Crea una función para calcular \(P^6\) \(P = \begin{pmatrix} 1 & 2 & 3 \\ -2 & 4 & -2 \\ 1 & 0 & 1 \end{pmatrix}\)

9. Resolver el sistema de ecuaciones \(3x - y + z = -1\\9x - 2y + z = -9\\3x + y - 2z = -9\)

10. Utilizando la ayuda de R, investigue para qué sirven las funciones eigen() y det()

11. Considerando las matrices

$$

B= \[\begin{pmatrix} 1 & 2 & 3 & 4 & 5 \\ 2 & 4 & 6 & 8 & 10 \\ 3 & 6 & 9 & 12 & 15 \\ 4 & 8 & 12 & 16 & 20 \\ 5 & 10 & 15 & 20 & 25 \\ 6 & 12 & 18 & 24 & 30 \\ 7 & 14 & 21 & 28 & 35 \\ 8 & 16 & 24 & 32 & 40 \\ 9 & 18 & 27 & 36 & 45 \\ 10 & 20 & 30 & 40 & 50 \end{pmatrix}\] A = \[\begin{pmatrix} 0 & 1 & 0 & 1 & 0 \\ 1 & 0 & 1 & 0 & 1 \\ 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 & 1 \\ 1 & 0 & 1 & 1 & 0 \\ \end{pmatrix}\]

$$

Calcular \(A \cdot B - A B^t\)

12. Considere \(\hat\beta = (X^t \cdot X)^{-1} \cdot X^t \cdot Y\)

Determine la matriz \(\hat\beta\)

$$

x= \[\begin{pmatrix}1 & 1\\ 1 & -1\\ 1 & 0\\ 1 & 1\\ 1 & 2\\ \end{pmatrix}\] y = \[\begin{pmatrix}0\\0\\1\\1\\3\\\end{pmatrix}\]

$$

13. Corre el siguiente código para cargar los vectores year y co2 en memoria

data(co2)
means = aggregate(co2, FUN=mean)
year = as.vector(time(means))
co2 = as.vector(means)
  • El vector co2 contiene medidas de \(CO_2\) en la atmósfera, en unidades de ppm, durante el periodo 1959-1997. El vector year contiene sus años correspondientes.
  • Calcular un vector de diferencias de \(CO_2\) entre años consecutivos, que sería:
    • \(CO_2\) en 1960 menos \(CO_2\) en 1959
    • \(CO_2\) en 1961 menos \(CO_2\) en 1960
    • y así sucesivamente…
  • Crear un plot con lineas y puntos mostrando las diferencias consecutivas de \(CO_2\) en función del tiempo (1960, 1961, etc…), en negrita
  • La diferencia de concentración de \(CO_2\) entre 2020 y 2019 fue igual a 2.64. Agregar un punto rojo representando esa diferencia al plot ya creado (usar una forma diferente, como pch=4)

14.

  • Lee el archivo rainfall.csv como un data.frame
  • Calcula e imprime un vector con los nombres de las estaciones donde al menos uno de los meses tiene una precipitación superior a 180mm.

8.3 Parte 3

15. Manipule los dataframe según se solicite

Se tiene el conjuntos de datos de precipitación diaria (período 1980 - 2013) de ciertas estaciones meteorológicas (raingaugeDataset.csv), donde cada una de estas están asociadas a un código único (p.e. qc00000208). Asimismo, se tiene una lista con los nombres, códigos, coordenadas y elevación de cada una de las estaciones (listRaingauge.csv).

A cada grupo le corresponde la siguiente estación:

  • Grupo 01: MALLARES
  • Grupo 02: TABACONAS
  • Grupo 03: PUERTO PIZARRO
  • Grupo 04: MORROPON
  • Grupo 05: SAN MIGUEL
  • Grupo 06: CHULUCANAS
  • Grupo 07: LAMBAYEQUE
  • Grupo 08: EL LIMON
  • Grupo 09: EL SALTO
  • Grupo 10: CHUSIS

De lo descrito anteriormente, se solicita:

  1. Determine la cantidad de missing values de la serie de tiempo a paso diario.
  2. Calcule la serie de tiempo de precipitación acumulada mensual (si el # de días con missing values, en un mes, supera el 10%, la precipitación acumulada mensual será considerado como un NA).
  3. Determine la cantidad de missing values de la serie de tiempo a paso mensual.
  4. Cree una función que calcule, a partir de los datos de preicpitación mensual, la climatología (Ene-Dic) para el período 1980-2010.
  5. Poltear (boxplot) la variabilidad de los valores mensuales (Ene-Dic) para el período 1980-2013.