Introducción a R base

Fundamentos básicos del lenguaje

2024-10-17

Bienvenidos y bienvenidas a Estación R

💬 Slack

🔗 Web

🐘 Mastodon

𝕏 X

✉️ Correo

Sobre el curso

  • Dinámica de la clase

    - Ejercitación semanal
    
    - Tp Integrador
    
    - Grabación de encuentros

Presentación

👋 Presentate acá

Hoja de Ruta

📌 ¿Qué es R?

📌 ¿Qué es la Ciencia de Datos?

📌 R != Rstudio

📌 Conceptos básicos de R

  👉🏼 Valores

  👉🏼 Vectores

  👉🏼 Tipos / Clases

  👉🏼 Data Frames

¿Qué es R?

Primera impresión

Evolución emocional

r project console

R …

  • Es un lenguaje de programación especializado en análisis y visualización de datos.

R …

  • Es de código abierto (se puede usar y modificar sin pagar licencias ni costos de ningún tipo)

R …

  • Crece a partir del aporte de su comunidad (no depende de un departamento de desarrollo):
    • Academia (Universidades)
    • Investigación Científica (Centros de investigación, comunidad científica)
    • Sector privado (Facebook, Google, X, Uber, Airbnb, IBM, New York times)
    • Gente de a pie (personas o grupos de personas)

R …

  • En el campo del análisis de datos, es la herramienta por excelencia en muchas universidades, empresas de tecnología, y redacciones de periodismo de datos.

¿Qué es la Ciencia de Datos?

¿Qué es la Ciencia de Datos?

r project console

R != Rstudio

R != Rstudio

r project console

R studio console

R != Rstudio

r project console

R studio console

Vamos a Rstudio!

Puesta a punto …

  • Identificar las 4 ventanas principales

Puesta a punto …

  • Identificar las 4 ventanas principales ✅


  • Cambiar la apariencia de la plataforma

Puesta a punto …

  • Identificar las 4 ventanas principales ✅


  • Cambiar la apariencia de la plataforma ✅


  • Setear en Opciones Globales (Global Options) la configuración General

Puesta a punto …

  • Identificar las 4 ventanas principales ✅


  • Cambiar la apariencia de la plataforma ✅


  • Setear en Opciones Globales (Global Options) la configuración General

Descanso

10:00

Conceptos básicos de R

Valores …

Valores …

numéricos

100
[1] 100

Valores …

de texto

"cien"
[1] "cien"

Valores …

¿?

"100"

Vectores … ¿variables?

Vectores … ¿variables?

numéricos

c(100, 102, 200)
[1] 100 102 200

Vectores … ¿variables?

de texto

c("cien", "ciento dos", "doscientos")
[1] "cien"       "ciento dos" "doscientos"

Vectores … ¿variables?

de texto

c("100", "102", "200")
[1] "100" "102" "200"

Funciones

  • Las funciones en R son el alma mater del lenguaje (de todos los lenguajes)

  • ellas reciben un input y devuelven un output

  • Siempre las encontrarás escrita así:

nombre_de_la_funcion(input)

Funciones

  • La función class() devuelve el tipo del valor o vector que le de (input)
class(1)
[1] "numeric"

Funciones

class("1")
[1] "character"

Funciones

  • La función length() devuelve el largo del input (probemos con un vector):
length(c(10, 20, 30))
[1] 3

Funciones

  • La función mean() calcula el promedio de un input (tiene que ser si o si numérico):
mean(c(10, 20, 30))
[1] 20

Funciones

mean(c("10", "20", "30"))
[1] NA

Objectos

  • Todo en R puede ser guardado en un objeto (un valor, un vector, el resutlado de una función, y más)

Objectos

  • Todo en R puede ser guardado en un objeto (un valor, un vector, el resutlado de una función, y más)

  • Para guardar algo en un objeto, tengo que seguir la siguiente estructura:

nombre_del_objeto <- algo

Objectos

guardo_un_numero <- 1

Objectos

guardo_un_numero
[1] 1

Objectos

guardo_un_vector <- c(10, 20, 30)

Objectos

guardo_un_vector
[1] 10 20 30

Objectos

guardo_un_resultado <- mean(c(20, 45, 23))

Objectos

guardo_un_resultado
[1] 29.33333

Objectos

objeto_como_input <- c(20, 45, 23)

mean(objeto_como_input)
[1] 29.33333

Ejercitación

Ejercitación

  • Crear un objeto con los siguientes 5 valores numéricos: 17, 92, 56, 32 y 102, y llamarlo edad_personas.

  • Con la función class() chequear de qué tipo es el objeto.

  • Con la función length() conocer la longitud de ese objeto (cuántos valores tiene).

  • Calcular el promedio de esos valores (la edad promedio)

Data Frames

Data Frames

  • Un Data Frame (o tabla) es la combinación de vectores (variables), que termina conformando una relación entre filas y columnas.

  • Cada vector es una columna de un dataframe, y cada uno de sus valores, en el orden en que se encuentran, conforman las filas.

Data Frames

  • Para crear un Data Frame puedo utilizar la función data.frame(), cuyos inputs son los vectores:
vector_edad <- c(20, 43, 102, 56)
vector_nombre <- c("Pepe", "Pepa", "Rigoberto", "Rodoberta")

base_personas <- data.frame(vector_edad,
                            vector_nombre)

Data Franes

  • Así se ve un data.frame:
base_personas
  vector_edad vector_nombre
1          20          Pepe
2          43          Pepa
3         102     Rigoberto
4          56     Rodoberta

Accediendo a un Data Frames

Recordar este comando: $

Accediendo a un Data Frames

  • Con el comando $ (símbolo peso) puedo acceder a una columna del data frame:

Accediendo a un Data Frane

base_personas$vector_nombre
[1] "Pepe"      "Pepa"      "Rigoberto" "Rodoberta"

Accediendo a un Data Frane

El resultado de base_personas$vector_nombre es nuevamente un vector, por lo que puedo:

class(base_personas$vector_nombre)
[1] "character"
length(base_personas$vector_nombre)
[1] 4

Ejercitación

Ejercitación

  • Crear un vector llamado serie, cuyos valores son: "Berlín", "The Crown" y "Vikings".

  • Crear un vector llamado puntaje, cuyos valores son (agregar puntaje a gusto),

  • Crear un data.frame llamado netflix, que combine los vectores anteriores

  • Calcular el puntaje promedio de las series de Netflix.

¡Listo!

  • Nos vemos el encuentro que viene.

  • Seguimos la comunicación entre clase y clase por Slack

  • Acá dejamos más ejercitación para seguir practicando