R-문자열

R에서 한 쌍의 작은 따옴표 또는 큰 따옴표 안에 기록 된 모든 값은 문자열로 처리됩니다. 내부적으로 R은 모든 문자열을 작은 따옴표로 생성하더라도 큰 따옴표 안에 저장합니다.

문자열 생성에 적용되는 규칙

  • 문자열의 시작과 끝에있는 따옴표는 모두 큰 따옴표이거나 모두 작은 따옴표 여야합니다. 그들은 섞일 수 없습니다.

  • 작은 따옴표로 시작하고 끝나는 문자열에 큰 따옴표를 삽입 할 수 있습니다.

  • 작은 따옴표는 큰 따옴표로 시작하고 끝나는 문자열에 삽입 할 수 있습니다.

  • 큰 따옴표로 시작하고 끝나는 문자열에는 큰 따옴표를 삽입 할 수 없습니다.

  • 작은 따옴표로 시작하고 끝나는 문자열에는 작은 따옴표를 삽입 할 수 없습니다.

유효한 문자열의 예

다음 예제는 R에서 문자열을 만드는 규칙을 설명합니다.

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

위의 코드가 실행되면 다음과 같은 출력이 나타납니다.

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"

유효하지 않은 문자열의 예

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

스크립트를 실행하면 아래 결과가 표시되지 않습니다.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

문자열 조작

문자열 연결-paste () 함수

R의 많은 문자열은 paste()함수. 여러 인수를 함께 결합 할 수 있습니다.

통사론

붙여 넣기 기능의 기본 구문은 다음과 같습니다.

paste(..., sep = " ", collapse = NULL)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • ... 결합 할 인수의 개수를 나타냅니다.

  • sep인수 사이의 구분 기호를 나타냅니다. 선택 사항입니다.

  • collapse두 문자열 사이의 공백을 제거하는 데 사용됩니다. 그러나 한 문자열의 두 단어 내의 공백은 아닙니다.

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

숫자 및 문자열 서식 지정-format () 함수

숫자와 문자열은 다음을 사용하여 특정 스타일로 서식을 지정할 수 있습니다. format() 함수.

통사론

형식 함수의 기본 구문은 다음과 같습니다.

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 벡터 입력입니다.

  • digits 표시되는 총 자릿수입니다.

  • nsmall 소수점 오른쪽에있는 최소 자릿수입니다.

  • scientific 과학적 표기법을 표시하려면 TRUE로 설정됩니다.

  • width 처음에 공백을 채워 표시 할 최소 너비를 나타냅니다.

  • justify 문자열을 왼쪽, 오른쪽 또는 가운데로 표시합니다.

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

문자열의 문자 수 계산-nchar () 함수

이 함수는 문자열의 공백을 포함한 문자 수를 계산합니다.

통사론

nchar () 함수의 기본 구문은 다음과 같습니다.

nchar(x)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 벡터 입력입니다.

result <- nchar("Count the number of characters")
print(result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] 30

대소 문자 변경-toupper () 및 tolower () 함수

이 함수는 문자열의 대소 문자를 변경합니다.

통사론

toupper () 및 tolower () 함수의 기본 구문은 다음과 같습니다.

toupper(x)
tolower(x)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 벡터 입력입니다.

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] "CHANGING TO UPPER"
[1] "changing to lower"

문자열의 일부 추출-substring () 함수

이 함수는 문자열의 일부를 추출합니다.

통사론

substring () 함수의 기본 구문은 다음과 같습니다.

substring(x,first,last)

다음은 사용 된 매개 변수에 대한 설명입니다.

  • x 문자형 벡터 입력입니다.

  • first 추출 할 첫 번째 문자의 위치입니다.

  • last 추출 할 마지막 문자의 위치입니다.

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

위 코드를 실행하면 다음과 같은 결과가 생성됩니다.

[1] "act"