R-데이터 유형
일반적으로 모든 프로그래밍 언어로 프로그래밍하는 동안 다양한 정보를 저장하기 위해 다양한 변수를 사용해야합니다. 변수는 값을 저장하기 위해 예약 된 메모리 위치 일뿐입니다. 이것은 변수를 만들 때 메모리에 약간의 공간을 예약한다는 것을 의미합니다.
문자, 와이드 문자, 정수, 부동 소수점, 이중 부동 소수점, 부울 등과 같은 다양한 데이터 유형의 정보를 저장하고 싶을 수 있습니다. 운영 체제는 변수의 데이터 유형에 따라 메모리를 할당하고 저장할 수있는 항목을 결정합니다. 예약 된 메모리.
R의 C 및 java와 같은 다른 프로그래밍 언어와 달리 변수는 일부 데이터 유형으로 선언되지 않습니다. 변수는 R-Objects와 함께 할당되며 R-object의 데이터 유형은 변수의 데이터 유형이됩니다. 많은 유형의 R- 객체가 있습니다. 자주 사용되는 것은-
- Vectors
- Lists
- Matrices
- Arrays
- Factors
- 데이터 프레임
이러한 개체 중 가장 간단한 것은 vector object이러한 원자 벡터에는 6 개의 데이터 유형이 있으며 6 개의 벡터 클래스라고도합니다. 다른 R-Object는 원자 벡터를 기반으로합니다.
데이터 형식 | 예 | 검증 |
---|---|---|
논리적 | 허위 사실 |
다음 결과를 생성합니다- |
숫자 | 12.3, 5, 999 |
다음 결과를 생성합니다- |
정수 | 2L, 34L, 0L |
다음 결과를 생성합니다- |
복잡한 | 3 + 2i |
다음 결과를 생성합니다- |
캐릭터 | 'a', ' "좋음", "TRUE", '23 .4' |
다음 결과를 생성합니다- |
노골적인 | "Hello"는 48 65 6c 6c 6f로 저장됩니다. |
다음 결과를 생성합니다- |
R 프로그래밍에서 가장 기본적인 데이터 유형은 다음과 같은 R- 객체입니다. vectors위에 표시된대로 다른 클래스의 요소를 보유합니다. R에서 클래스 수는 위의 6 가지 유형에만 국한되지 않습니다. 예를 들어, 많은 원자 벡터를 사용하고 클래스가 배열이 될 배열을 만들 수 있습니다.
벡터
두 개 이상의 요소가있는 벡터를 만들려면 다음을 사용해야합니다. c() 요소를 벡터로 결합하는 함수입니다.
# Create a vector.
apple <- c('red','green',"yellow")
print(apple)
# Get the class of the vector.
print(class(apple))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] "red" "green" "yellow"
[1] "character"
기울기
목록은 벡터, 함수 및 그 안에있는 다른 목록과 같이 내부에 다양한 유형의 요소를 포함 할 수있는 R- 객체입니다.
# Create a list.
list1 <- list(c(2,5,3),21.3,sin)
# Print the list.
print(list1)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[[1]]
[1] 2 5 3
[[2]]
[1] 21.3
[[3]]
function (x) .Primitive("sin")
행렬
행렬은 2 차원 직사각형 데이터 세트입니다. 행렬 함수에 벡터 입력을 사용하여 만들 수 있습니다.
# Create a matrix.
M = matrix( c('a','a','b','c','b','a'), nrow = 2, ncol = 3, byrow = TRUE)
print(M)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[,1] [,2] [,3]
[1,] "a" "a" "b"
[2,] "c" "b" "a"
배열
행렬은 2 차원으로 제한되지만 배열은 원하는 수의 차원 일 수 있습니다. 배열 함수는 필요한 수의 차원을 생성하는 dim 속성을 사용합니다. 아래 예에서 우리는 각각 3x3 행렬 인 두 개의 요소로 배열을 만듭니다.
# Create an array.
a <- array(c('green','yellow'),dim = c(3,3,2))
print(a)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
, , 1
[,1] [,2] [,3]
[1,] "green" "yellow" "green"
[2,] "yellow" "green" "yellow"
[3,] "green" "yellow" "green"
, , 2
[,1] [,2] [,3]
[1,] "yellow" "green" "yellow"
[2,] "green" "yellow" "green"
[3,] "yellow" "green" "yellow"
요인
요인은 벡터를 사용하여 생성 된 r- 객체입니다. 벡터에있는 요소의 고유 값과 함께 벡터를 레이블로 저장합니다. 레이블은 입력 벡터에서 숫자인지 문자인지 또는 부울인지에 관계없이 항상 문자입니다. 통계 모델링에 유용합니다.
요인은 factor()함수. 그만큼nlevels 함수는 레벨 수를 제공합니다.
# Create a vector.
apple_colors <- c('green','green','yellow','red','red','red','green')
# Create a factor object.
factor_apple <- factor(apple_colors)
# Print the factor.
print(factor_apple)
print(nlevels(factor_apple))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] green green yellow red red red green
Levels: green red yellow
[1] 3
데이터 프레임
데이터 프레임은 표 형식의 데이터 개체입니다. 데이터 프레임의 행렬과 달리 각 열에는 서로 다른 데이터 모드가 포함될 수 있습니다. 첫 번째 열은 숫자 일 수 있고 두 번째 열은 문자 일 수 있고 세 번째 열은 논리적 일 수 있습니다. 길이가 같은 벡터 목록입니다.
데이터 프레임은 data.frame() 함수.
# Create the data frame.
BMI <- data.frame(
gender = c("Male", "Male","Female"),
height = c(152, 171.5, 165),
weight = c(81,93, 78),
Age = c(42,38,26)
)
print(BMI)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
gender height weight Age
1 Male 152.0 81 42
2 Male 171.5 93 38
3 Female 165.0 78 26