R - Strings

Qualquer valor escrito em um par de aspas simples ou duplas em R é tratado como uma string. Internamente, R armazena cada string entre aspas duplas, mesmo quando você as cria com aspas simples.

Regras aplicadas na construção de strings

  • As aspas no início e no final de uma string devem ser aspas duplas ou simples. Eles não podem ser misturados.

  • As aspas duplas podem ser inseridas em uma string começando e terminando com aspas simples.

  • As aspas simples podem ser inseridas em uma string começando e terminando com aspas duplas.

  • As aspas duplas não podem ser inseridas em uma string começando e terminando com aspas duplas.

  • As aspas simples não podem ser inseridas em uma string começando e terminando com aspas simples.

Exemplos de strings válidas

Os exemplos a seguir esclarecem as regras sobre a criação de uma string em R.

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

Quando o código acima é executado, obtemos a seguinte saída -

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"

Exemplos de strings inválidas

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

Quando executamos o script, ele falha dando os resultados abaixo.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

Manipulação de Cordas

Concatenando Strings - função paste ()

Muitas strings em R são combinadas usando o paste()função. Pode levar qualquer número de argumentos para serem combinados.

Sintaxe

A sintaxe básica para a função colar é -

paste(..., sep = " ", collapse = NULL)

A seguir está a descrição dos parâmetros usados ​​-

  • ... representa qualquer número de argumentos a serem combinados.

  • seprepresenta qualquer separador entre os argumentos. É opcional.

  • collapseé usado para eliminar o espaço entre duas strings. Mas não o espaço dentro de duas palavras de uma string.

Exemplo

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

Quando executamos o código acima, ele produz o seguinte resultado -

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

Formatando números e strings - função format ()

Números e strings podem ser formatados para um estilo específico usando format() função.

Sintaxe

A sintaxe básica para a função de formato é -

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

A seguir está a descrição dos parâmetros usados ​​-

  • x é a entrada do vetor.

  • digits é o número total de dígitos exibidos.

  • nsmall é o número mínimo de dígitos à direita da vírgula decimal.

  • scientific é definido como TRUE para exibir notação científica.

  • width indica a largura mínima a ser exibida preenchendo espaços em branco no início.

  • justify é a exibição da corda à esquerda, direita ou centro.

Exemplo

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

Quando executamos o código acima, ele produz o seguinte resultado -

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

Contando o número de caracteres em uma string - função nchar ()

Esta função conta o número de caracteres, incluindo espaços em uma string.

Sintaxe

A sintaxe básica para a função nchar () é -

nchar(x)

A seguir está a descrição dos parâmetros usados ​​-

  • x é a entrada do vetor.

Exemplo

result <- nchar("Count the number of characters")
print(result)

Quando executamos o código acima, ele produz o seguinte resultado -

[1] 30

Alterando o caso - funções toupper () e tolower ()

Essas funções alteram a capitalização dos caracteres de uma string.

Sintaxe

A sintaxe básica para a função toupper () & tolower () é -

toupper(x)
tolower(x)

A seguir está a descrição dos parâmetros usados ​​-

  • x é a entrada do vetor.

Exemplo

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

Quando executamos o código acima, ele produz o seguinte resultado -

[1] "CHANGING TO UPPER"
[1] "changing to lower"

Extraindo partes de uma função string - substring ()

Esta função extrai partes de uma String.

Sintaxe

A sintaxe básica para a função substring () é -

substring(x,first,last)

A seguir está a descrição dos parâmetros usados ​​-

  • x é a entrada do vetor de caracteres.

  • first é a posição do primeiro caractere a ser extraído.

  • last é a posição do último caractere a ser extraído.

Exemplo

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

Quando executamos o código acima, ele produz o seguinte resultado -

[1] "act"