Data Frames

Un data frame podría traducirse como una hoja de datos o marco de datos. La estructura de un data frame es muy similar a la de una matriz, la diferencia es que una matriz solo admite valores de un mismo tipo, mientras que en un data frame puede incluir diferente tipos de datos.

Tipo de variable Ejemplo Clase de objeto en R
Cuantitativa discreta 1 integer
Cuantitativa continua 1.5 numeric
Cualitativa nominal Gato character o factor
Cualitativa ordinal Gato factor
Lógico TRUE logical

Factores

Los factores son usados para representar las variables cualitativas o categóricas. Por defecto los factores no tienen orden (variable cualitativa nominal), pero el usuario puede establecer un orden (variable cualitativa ordinal). Los factores son importantes ya que serán utilizados análisis estadísticos y gráficos. Para ordenar una variable cualitativa en R puede revisar la seccion de como Ordenar vectores.

Operadores relacionales

Las expresiones booleanas de comparación son declaraciones lógicas que son verdaderas o falsas. Para nuestros propósitos, a menudo usaremos expresiones booleanas para comparar cantidades. Por ejemplo, la expresión booleana 1 < 2 es verdadera, mientras que la expresión booleana 1 > 2 es falsa.

Operador Descripción
< menor que
<= Menor o igual
> Mayor que
>= Menor o igual
== Igual
!= Distindo de

Crear Data Frames

Se pueden crear data frames con la función data.frame().

## Crear vectores con diferentes tipos de datos
entero <- 1:4 
factor <- factor(c("a", "b", "c", "d"))
numero <- c(1.2, 3.4, 4.5, 5.6)
cadena <- as.character(c("a", "b", "c", "d"))
logico <- as.logical(c("TRUE", "FALSE", "FALSE", "TRUE"))
## Unir todos los vectores en un df
my_df <- data.frame(entero, factor, numero, cadena, logico)
## Revisar la estructura de los datos
str(my_df)

Set de datos Iris

Ronald Fisher trabajo con tres especies de Iris (I. setosa, I. virginica e I. versicolor), he hizo la medición del largo y ancho del pétalo y sépalo. Estos cuantifican la variación morfológica de la flor, todas las medidas están en centímetros.

Visualización rápida de Datos

En R tenemos dos comandos que suelen ir de la mano que permiten visualizar los primeros y últimos elementos de un data frame, también podemos obtener un resumen estadístico rápido de los datos.

## Ver hasta las primeras 6 filas
head(iris)
## Ver hasta las ultimas 6 filas
tail(iris)
## Resumen rápido de los datos
summary(iris)

Acceder a los elementos de un data frames

Es similar a una matriz utilizando los corchetes [], poniendo primero el número de fila y en seguida el número de columna separados por una coma. En los data frames tambien podemos acceder a las columnas utilizando el operador $.

## Selecciona la variable Species
iris$Species    
## Selecciona la variable ancho del pétalo
iris$Petal.Width 
## Seleccionar la especie setosa 
iris[iris$Species == "setosa", ]