R - Strings
Qualquer valor escrito em um par de aspas simples ou duplas em R é tratado como uma string. Internamente, R armazena cada string entre aspas duplas, mesmo quando você as cria com aspas simples.
Regras aplicadas na construção de strings
As aspas no início e no final de uma string devem ser aspas duplas ou simples. Eles não podem ser misturados.
As aspas duplas podem ser inseridas em uma string começando e terminando com aspas simples.
As aspas simples podem ser inseridas em uma string começando e terminando com aspas duplas.
As aspas duplas não podem ser inseridas em uma string começando e terminando com aspas duplas.
As aspas simples não podem ser inseridas em uma string começando e terminando com aspas simples.
Exemplos de strings válidas
Os exemplos a seguir esclarecem as regras sobre a criação de uma string em R.
a <- 'Start and end with single quote'
print(a)
b <- "Start and end with double quotes"
print(b)
c <- "single quote ' in between double quotes"
print(c)
d <- 'Double quotes " in between single quote'
print(d)
Quando o código acima é executado, obtemos a seguinte saída -
[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"
Exemplos de strings inválidas
e <- 'Mixed quotes"
print(e)
f <- 'Single quote ' inside single quote'
print(f)
g <- "Double quotes " inside double quotes"
print(g)
Quando executamos o script, ele falha dando os resultados abaixo.
Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted
Manipulação de Cordas
Concatenando Strings - função paste ()
Muitas strings em R são combinadas usando o paste()função. Pode levar qualquer número de argumentos para serem combinados.
Sintaxe
A sintaxe básica para a função colar é -
paste(..., sep = " ", collapse = NULL)
A seguir está a descrição dos parâmetros usados -
... representa qualquer número de argumentos a serem combinados.
seprepresenta qualquer separador entre os argumentos. É opcional.
collapseé usado para eliminar o espaço entre duas strings. Mas não o espaço dentro de duas palavras de uma string.
Exemplo
a <- "Hello"
b <- 'How'
c <- "are you? "
print(paste(a,b,c))
print(paste(a,b,c, sep = "-"))
print(paste(a,b,c, sep = "", collapse = ""))
Quando executamos o código acima, ele produz o seguinte resultado -
[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "
Formatando números e strings - função format ()
Números e strings podem ser formatados para um estilo específico usando format() função.
Sintaxe
A sintaxe básica para a função de formato é -
format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))
A seguir está a descrição dos parâmetros usados -
x é a entrada do vetor.
digits é o número total de dígitos exibidos.
nsmall é o número mínimo de dígitos à direita da vírgula decimal.
scientific é definido como TRUE para exibir notação científica.
width indica a largura mínima a ser exibida preenchendo espaços em branco no início.
justify é a exibição da corda à esquerda, direita ou centro.
Exemplo
# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)
# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)
# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)
# Format treats everything as a string.
result <- format(6)
print(result)
# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)
# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)
# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)
Quando executamos o código acima, ele produz o seguinte resultado -
[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] " 13.7"
[1] "Hello "
[1] " Hello "
Contando o número de caracteres em uma string - função nchar ()
Esta função conta o número de caracteres, incluindo espaços em uma string.
Sintaxe
A sintaxe básica para a função nchar () é -
nchar(x)
A seguir está a descrição dos parâmetros usados -
x é a entrada do vetor.
Exemplo
result <- nchar("Count the number of characters")
print(result)
Quando executamos o código acima, ele produz o seguinte resultado -
[1] 30
Alterando o caso - funções toupper () e tolower ()
Essas funções alteram a capitalização dos caracteres de uma string.
Sintaxe
A sintaxe básica para a função toupper () & tolower () é -
toupper(x)
tolower(x)
A seguir está a descrição dos parâmetros usados -
x é a entrada do vetor.
Exemplo
# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)
# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)
Quando executamos o código acima, ele produz o seguinte resultado -
[1] "CHANGING TO UPPER"
[1] "changing to lower"
Extraindo partes de uma função string - substring ()
Esta função extrai partes de uma String.
Sintaxe
A sintaxe básica para a função substring () é -
substring(x,first,last)
A seguir está a descrição dos parâmetros usados -
x é a entrada do vetor de caracteres.
first é a posição do primeiro caractere a ser extraído.
last é a posição do último caractere a ser extraído.
Exemplo
# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)
Quando executamos o código acima, ele produz o seguinte resultado -
[1] "act"