نحوه وارد کردن داده ها در R

بازدید: 410 بازدید

زبان برنامه نویسی R به دلایل مختلفی از قبیل منبع باز بودن، یوزر فرندلی بودن، قدرت بالای تجزیه و تحلیل داده و مصور سازی انواع داده ها، یکی از برنامه های محبوب در بین کاربران است. در این مقاله نحوه وارد کردن داده ها در R را به روش های مختلف آموزش می دهیم.

چطوری یک بردار را به صورت دستی وارد R کنیم؟

این یک تمرین بسیار ساده است. برای اینکه بدانیم برنامه R چطوری کار می کند.

#create vector of numeric values
numeric_values <- c(1, 3, 5, 8, 9)

#display class of vector
class(numeric_values)

[1] "numeric"
#display vector of numeric values
numeric_values

[1] 1 3 5 8 9

#return second element in vector
numeric_values[4]

[1] 8

نکته: برای نوشتن توضیحات در برنامه R از علامت # استفاده می کنیم

نحوه وارد کردن دستی یک بردار رشته ای در برنامه R

#create vector of character values
char_values <- c("Ali", "Mona", "Parham", "Parvane")

#display class of vector
class(char_values)

[1] "character"

نحوه وارد کردن یک دیتا فریم در R

زبان برنامه برنویسی R یک سری قاعده مخصوص به خودش را دارد که برای کار با آن لازم است این قواعد را به خوبی بشناسیم. برای وارد کردن یک جدول داده به صورت دستی، از طریق دستور data.frame می توانیم اقدام کنیم.

#create data frame
df <- data.frame(team=c("A", "A", "B", "B", "C"),
                 points=c(12, 15, 17, 24, 27),
                 assists=c(4, 7, 7, 8, 12))

#display data frame
df

  team points assists
1    A     12       4
2    A     15       7
3    B     17       7
4    B     24       8
5    C     27      12

#display class of df
class(df)

[1] "data.frame"

#return value in fourth row and third column
df[4, 3]

[1] 8

نحوه وارد کردن یک ماتریس در R

با استفاه از کدهای زیر می توانیم مقادیر یک ماتریس را در R وارد کنیم.

#create matrix with two columns and five rows
points=c(12, 15, 17, 24, 27)
assists=c(4, 7, 7, 8, 12)

#column bind the two vectors together to create a matrix
mat <- cbind(points, assists)

#display matrix
mat

     points assists
[1,]     12       4
[2,]     15       7
[3,]     17       7
[4,]     24       8
[5,]     27      12

#display class of mat
class(mat)

[1] "matrix"

#return value in fourth row and second column
mat[4, 2]

assists 
      8

نکته: برای وارد کردن مقادیر یک ماتریس در R باید همه مقادیر از یک نوع باشند، برای مثال همه مقادیر باید عددی باشند و نمی توانند کاراکتر به خود بگیرند.

نحوه وارد کردن یک فایل csv در R

سه روش برای وارد کردن یک فایل csv به R وجود دارد:

روش اول: استفاده از کدهای پایه ای R

استفاده از کدهای پایه ای R است، که در قطعه کد زیر می توانید نمونه آن را ببینید. کار با این روش بسیار ساده است ولی سرعت بارگذاری داده ها پایین است. اما برای داده های کوچک به خوبی کار می کند.

data1 <- read.csv("C:\\Users\\Bob\\Desktop\\data.csv", header=TRUE, stringsAsFactors=FALSE)

روش دوم: استفاده از (Package) یاکتابخانه reader

در کتابخانه reader سرعت بارگذاری داده ها 2 تا 3 برابر روش اول است.

library(readr) 
data2 <- read_csv("C:\\Users\\Ecohadi\\Desktop\\data.csv")

روش سوم: استفاده از Package یا کتابخانه data.table

می توانیم برای وارد کردن داده های csv به R از کتابخانه data.table استفاده کنیم. با کتابخانه data.table سرعت بارگذاری داده ها 2 تا 3 برابر روش اول است.

library(data.table)
data3 <- fread("C:\\Users\\Ecohadi\\Desktop\\data.csv")

نحوه وارد کردن داده های csv از web یا اینترنت در R

سه روش برای وارد کردن یک فایل csv از اینترنت به R وجود دارد:

روش اول: استفاده از کدهای پایه ای R

با استفاده از کدهای پایه ای R می توانیم داده های csv از اینترنت را به R را وارد کنیم.

#import data from URL
data <- read.csv('http://apps.fs.fed.us/fiadb-downloads/CSV/LICHEN_SPECIES_SUMMARY.csv')

#view first five rows
head(data)

روش دوم: استفاده از package یا کتابخانه reader

با استفاده از کتابخانه reader می توانیم داده های csv از اینترنت را به R را وارد کنیم.

library(readr)

#import data from URL
data3 <- fread('http://apps.fs.fed.us/fiadb-downloads/CSV/LICHEN_SPECIES_SUMMARY.csv')

#view first five rows
head(data3)

روش سوم: استفاده از package یا کتابخانه data.table

یکی دیگر از روش های  وارد کردن داده های csv تحت وب استفاده از کتابخانه data.table است.

library(data.table)

#import data from URL
data2 <- fread('http://apps.fs.fed.us/fiadb-downloads/CSV/LICHEN_SPECIES_SUMMARY.csv')

#view first five rows
head(data2)