R - Cordes
Toute valeur écrite dans une paire de guillemets simples ou doubles dans R est traitée comme une chaîne. En interne, R stocke chaque chaîne entre guillemets, même lorsque vous les créez avec des guillemets simples.
Règles appliquées dans la construction de chaînes
Les guillemets au début et à la fin d'une chaîne doivent être à la fois des guillemets doubles ou des guillemets simples. Ils ne peuvent pas être mélangés.
Des guillemets doubles peuvent être insérés dans une chaîne commençant et se terminant par un guillemet simple.
Les guillemets simples peuvent être insérés dans une chaîne commençant et se terminant par des guillemets doubles.
Les guillemets doubles ne peuvent pas être insérés dans une chaîne commençant et se terminant par des guillemets doubles.
Le guillemet simple ne peut pas être inséré dans une chaîne commençant et se terminant par un guillemet simple.
Exemples de chaînes valides
Les exemples suivants clarifient les règles de création d'une chaîne dans R.
a <- 'Start and end with single quote'
print(a)
b <- "Start and end with double quotes"
print(b)
c <- "single quote ' in between double quotes"
print(c)
d <- 'Double quotes " in between single quote'
print(d)
Lorsque le code ci-dessus est exécuté, nous obtenons la sortie suivante -
[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"
Exemples de chaînes non valides
e <- 'Mixed quotes"
print(e)
f <- 'Single quote ' inside single quote'
print(f)
g <- "Double quotes " inside double quotes"
print(g)
Lorsque nous exécutons le script, il ne donne pas les résultats ci-dessous.
Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted
Manipulation de chaînes
Concaténation de chaînes - fonction paste ()
De nombreuses chaînes de R sont combinées à l'aide du paste()fonction. Il peut prendre n'importe quel nombre d'arguments pour être combiné.
Syntaxe
La syntaxe de base de la fonction coller est -
paste(..., sep = " ", collapse = NULL)
Voici la description des paramètres utilisés -
... représente n'importe quel nombre d'arguments à combiner.
sepreprésente tout séparateur entre les arguments. C'est facultatif.
collapseest utilisé pour éliminer l'espace entre deux chaînes. Mais pas l'espace entre deux mots d'une chaîne.
Exemple
a <- "Hello"
b <- 'How'
c <- "are you? "
print(paste(a,b,c))
print(paste(a,b,c, sep = "-"))
print(paste(a,b,c, sep = "", collapse = ""))
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -
[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "
Formatage des nombres et des chaînes - fonction format ()
Les nombres et les chaînes peuvent être formatés dans un style spécifique à l'aide de format() fonction.
Syntaxe
La syntaxe de base de la fonction de format est -
format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))
Voici la description des paramètres utilisés -
x est l'entrée vectorielle.
digits est le nombre total de chiffres affichés.
nsmall est le nombre minimum de chiffres à droite du point décimal.
scientific est réglé sur TRUE pour afficher la notation scientifique.
width indique la largeur minimale à afficher en remplissant les blancs au début.
justify est l'affichage de la chaîne à gauche, à droite ou au centre.
Exemple
# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)
# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)
# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)
# Format treats everything as a string.
result <- format(6)
print(result)
# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)
# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)
# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -
[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] " 13.7"
[1] "Hello "
[1] " Hello "
Comptage du nombre de caractères dans une chaîne - fonction nchar ()
Cette fonction compte le nombre de caractères, espaces compris dans une chaîne.
Syntaxe
La syntaxe de base de la fonction nchar () est -
nchar(x)
Voici la description des paramètres utilisés -
x est l'entrée vectorielle.
Exemple
result <- nchar("Count the number of characters")
print(result)
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -
[1] 30
Changer la casse - fonctions toupper () et tolower ()
Ces fonctions modifient la casse des caractères d'une chaîne.
Syntaxe
La syntaxe de base de la fonction toupper () et tolower () est -
toupper(x)
tolower(x)
Voici la description des paramètres utilisés -
x est l'entrée vectorielle.
Exemple
# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)
# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -
[1] "CHANGING TO UPPER"
[1] "changing to lower"
Extraction de parties d'une chaîne - fonction substring ()
Cette fonction extrait des parties d'une chaîne.
Syntaxe
La syntaxe de base de la fonction substring () est -
substring(x,first,last)
Voici la description des paramètres utilisés -
x est l'entrée du vecteur de caractères.
first est la position du premier caractère à extraire.
last est la position du dernier caractère à extraire.
Exemple
# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)
Lorsque nous exécutons le code ci-dessus, cela produit le résultat suivant -
[1] "act"