Lectura del archivo CSV en marcos de datos en R

Con la ayuda de funciones específicas que ofrece R, leer los archivos CSV en marcos de datos es mucho más fácil.

¿Qué es un archivo CSV?

El formato CSV se expande como Valores separados por comas. En este archivo, los valores almacenados están separados por una coma. Este proceso de almacenamiento de datos es mucho más sencillo.


¿Por qué CSV es el formato de archivo más utilizado para almacenar datos?

Almacenar los datos en una hoja de cálculo de Excel es la práctica más común en muchas empresas. En la mayoría de las empresas, las personas almacenan los datos como valores separados por comas (CSV), ya que el proceso es más sencillo que crear hojas de cálculo normales. Más tarde, pueden usar los paquetes integrados de R para leer y analizar los datos.

Al ser el lenguaje de programación de análisis estadístico más popular y poderoso, R ofrece funciones específicas para leer datos en marcos de datos organizados desde un archivo CSV.


Lectura de archivo CSV en marco de datos

En este breve ejemplo, veremos cómo podemos leer un archivo CSV en marcos de datos organizados.

Lo primero que hay que hacer en este proceso es obtener y configurar el directorio de trabajo. Es necesario elegir la ruta de trabajo del archivo CSV.

1. Configuración del directorio de trabajo

Aquí puede verificar el directorio de trabajo predeterminado usando la función getwd() y también puede cambiar el directorio usando la función setwd().

getwd() #Shows the default working directory ----   "C:/Users/Dell/Documents" setwd("C:UsersDellDocumentsR-test data") #to set the new working Directory getwd() #you can see the updated working directory--- "C:/Users/Dell/Documents/R-test data"

2. Importación y lectura del conjunto de datos/archivo CSV

Después de configurar la ruta de trabajo, debe importar el conjunto de datos o un archivo CSV como se muestra a continuación.

 readfile - read.csv("testdata.txt")

Ejecute la línea de código anterior en R Studio para obtener el marco de datos como se muestra a continuación.

Para comprobar la clase de la variable ‘readfile’, ejecute el siguiente código.

 class(readfile)--- "data.frame"            

En la imagen de arriba se puede ver el marco de datos que incluye la información de los nombres de los estudiantes, sus identificaciones, departamentos, género y calificaciones.

3. Extracción de la información del estudiante del archivo CSV

Después de obtener el marco de datos, puede analizar los datos y extraer información específica del marco de datos.

Para extraer las calificaciones más altas obtenidas por los estudiantes,

marks - max(data$Marks.Scored) #this will give you the highest marks#To extract the details of a student who scored the highest marks, data - read.csv("traindata.csv") Marks - max(data$Marks.Scored) retval - subset(data, Marks.Scored == max(Marks.Scored))   #This will extract the details of the student who secured highest marks  View(retval)

Para extraer los detalles de los estudiantes que estudian en el Departamento de ‘Química’,

 readfile - read.csv("traindata.csv") retval - subset( data, Department == "chemistry")  # This will extract the student details who are in Biochemistry department   View(retval)

Conclusión

Mediante este proceso, puede leer los archivos csv en R con el uso de la función read.csv(“ “). Este tutorial explica cómo importar el archivo csv y leerlo, además de extraer información específica del marco de datos.

Utilicé R Studio para este proyecto. RStudio ofrece excelentes funciones, como consola, editor y entorno. De todos modos, puedes utilizar otros editores como Thinn-R, Crimson Editor, etc. Espero que este tutorial te ayude a comprender la lectura de archivos CSV en R y a extraer información del marco de datos.

Para más información lea: https://cran.r-project.org/manuals.html

SUSCRÍBETE A NUESTRO BOLETÍN 
No te pierdas de nuestro contenido ni de ninguna de nuestras guías para que puedas avanzar en los juegos que más te gustan.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Scroll al inicio