R-문자열
R에서 한 쌍의 작은 따옴표 또는 큰 따옴표 안에 기록 된 모든 값은 문자열로 처리됩니다. 내부적으로 R은 모든 문자열을 작은 따옴표로 생성하더라도 큰 따옴표 안에 저장합니다.
문자열 생성에 적용되는 규칙
문자열의 시작과 끝에있는 따옴표는 모두 큰 따옴표이거나 모두 작은 따옴표 여야합니다. 그들은 섞일 수 없습니다.
작은 따옴표로 시작하고 끝나는 문자열에 큰 따옴표를 삽입 할 수 있습니다.
작은 따옴표는 큰 따옴표로 시작하고 끝나는 문자열에 삽입 할 수 있습니다.
큰 따옴표로 시작하고 끝나는 문자열에는 큰 따옴표를 삽입 할 수 없습니다.
작은 따옴표로 시작하고 끝나는 문자열에는 작은 따옴표를 삽입 할 수 없습니다.
유효한 문자열의 예
다음 예제는 R에서 문자열을 만드는 규칙을 설명합니다.
a <- 'Start and end with single quote'
print(a)
b <- "Start and end with double quotes"
print(b)
c <- "single quote ' in between double quotes"
print(c)
d <- 'Double quotes " in between single quote'
print(d)
위의 코드가 실행되면 다음과 같은 출력이 나타납니다.
[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"
유효하지 않은 문자열의 예
e <- 'Mixed quotes"
print(e)
f <- 'Single quote ' inside single quote'
print(f)
g <- "Double quotes " inside double quotes"
print(g)
스크립트를 실행하면 아래 결과가 표시되지 않습니다.
Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted
문자열 조작
문자열 연결-paste () 함수
R의 많은 문자열은 paste()함수. 여러 인수를 함께 결합 할 수 있습니다.
통사론
붙여 넣기 기능의 기본 구문은 다음과 같습니다.
paste(..., sep = " ", collapse = NULL)
다음은 사용 된 매개 변수에 대한 설명입니다.
... 결합 할 인수의 개수를 나타냅니다.
sep인수 사이의 구분 기호를 나타냅니다. 선택 사항입니다.
collapse두 문자열 사이의 공백을 제거하는 데 사용됩니다. 그러나 한 문자열의 두 단어 내의 공백은 아닙니다.
예
a <- "Hello"
b <- 'How'
c <- "are you? "
print(paste(a,b,c))
print(paste(a,b,c, sep = "-"))
print(paste(a,b,c, sep = "", collapse = ""))
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "
숫자 및 문자열 서식 지정-format () 함수
숫자와 문자열은 다음을 사용하여 특정 스타일로 서식을 지정할 수 있습니다. format() 함수.
통사론
형식 함수의 기본 구문은 다음과 같습니다.
format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))
다음은 사용 된 매개 변수에 대한 설명입니다.
x 벡터 입력입니다.
digits 표시되는 총 자릿수입니다.
nsmall 소수점 오른쪽에있는 최소 자릿수입니다.
scientific 과학적 표기법을 표시하려면 TRUE로 설정됩니다.
width 처음에 공백을 채워 표시 할 최소 너비를 나타냅니다.
justify 문자열을 왼쪽, 오른쪽 또는 가운데로 표시합니다.
예
# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)
# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)
# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)
# Format treats everything as a string.
result <- format(6)
print(result)
# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)
# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)
# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] " 13.7"
[1] "Hello "
[1] " Hello "
문자열의 문자 수 계산-nchar () 함수
이 함수는 문자열의 공백을 포함한 문자 수를 계산합니다.
통사론
nchar () 함수의 기본 구문은 다음과 같습니다.
nchar(x)
다음은 사용 된 매개 변수에 대한 설명입니다.
x 벡터 입력입니다.
예
result <- nchar("Count the number of characters")
print(result)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] 30
대소 문자 변경-toupper () 및 tolower () 함수
이 함수는 문자열의 대소 문자를 변경합니다.
통사론
toupper () 및 tolower () 함수의 기본 구문은 다음과 같습니다.
toupper(x)
tolower(x)
다음은 사용 된 매개 변수에 대한 설명입니다.
x 벡터 입력입니다.
예
# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)
# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] "CHANGING TO UPPER"
[1] "changing to lower"
문자열의 일부 추출-substring () 함수
이 함수는 문자열의 일부를 추출합니다.
통사론
substring () 함수의 기본 구문은 다음과 같습니다.
substring(x,first,last)
다음은 사용 된 매개 변수에 대한 설명입니다.
x 문자형 벡터 입력입니다.
first 추출 할 첫 번째 문자의 위치입니다.
last 추출 할 마지막 문자의 위치입니다.
예
# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)
위 코드를 실행하면 다음과 같은 결과가 생성됩니다.
[1] "act"