Data Frames
Un data frame podría traducirse como una hoja de datos o marco de datos. La estructura de un data frame es muy similar a la de una matriz, la diferencia es que una matriz solo admite valores de un mismo tipo, mientras que en un data frame puede incluir diferente tipos de datos.
Tipo de variable | Ejemplo | Clase de objeto en R |
---|---|---|
Cuantitativa discreta | 1 | integer |
Cuantitativa continua | 1.5 | numeric |
Cualitativa nominal | Gato | character o factor |
Cualitativa ordinal | Gato | factor |
Lógico | TRUE | logical |
Factores
Los factores son usados para representar las variables cualitativas o categóricas. Por defecto los factores no tienen orden (variable cualitativa nominal), pero el usuario puede establecer un orden (variable cualitativa ordinal). Los factores son importantes ya que serán utilizados análisis estadísticos y gráficos. Para ordenar una variable cualitativa en R puede revisar la seccion de como Ordenar vectores.
Operadores relacionales
Las expresiones booleanas de comparación son declaraciones lógicas que son verdaderas o falsas. Para nuestros propósitos, a menudo usaremos expresiones booleanas para comparar cantidades. Por ejemplo, la expresión booleana 1 < 2
es verdadera, mientras que la expresión booleana 1 > 2
es falsa.
Operador | Descripción |
---|---|
< |
menor que |
<= |
Menor o igual |
> |
Mayor que |
>= |
Menor o igual |
== |
Igual |
!= |
Distindo de |
Crear Data Frames
Se pueden crear data frames con la función data.frame()
.
## Crear vectores con diferentes tipos de datos
entero <- 1:4
factor <- factor(c("a", "b", "c", "d"))
numero <- c(1.2, 3.4, 4.5, 5.6)
cadena <- as.character(c("a", "b", "c", "d"))
logico <- as.logical(c("TRUE", "FALSE", "FALSE", "TRUE"))
## Unir todos los vectores en un df
my_df <- data.frame(entero, factor, numero, cadena, logico)
## Revisar la estructura de los datos
str(my_df)
Set de datos Iris
Ronald Fisher trabajo con tres especies de Iris (I. setosa, I. virginica e I. versicolor), he hizo la medición del largo y ancho del pétalo y sépalo. Estos cuantifican la variación morfológica de la flor, todas las medidas están en centímetros.
Visualización rápida de Datos
En R tenemos dos comandos que suelen ir de la mano que permiten visualizar los primeros y últimos elementos de un data frame, también podemos obtener un resumen estadístico rápido de los datos.
## Ver hasta las primeras 6 filas
head(iris)
## Ver hasta las ultimas 6 filas
tail(iris)
## Resumen rápido de los datos
summary(iris)
Acceder a los elementos de un data frames
Es similar a una matriz utilizando los corchetes []
, poniendo primero el número de fila y en seguida el número de columna separados por una coma. En los data frames tambien podemos acceder a las columnas utilizando el operador $
.
## Selecciona la variable Species
iris$Species
## Selecciona la variable ancho del pétalo
iris$Petal.Width
## Seleccionar la especie setosa
iris[iris$Species == "setosa", ]