R - Saiten

Jeder Wert, der in einem Paar von einfachen oder doppelten Anführungszeichen in R geschrieben wird, wird als Zeichenfolge behandelt. Intern speichert R jede Zeichenfolge in doppelten Anführungszeichen, auch wenn Sie sie mit einfachen Anführungszeichen erstellen.

Regeln für die String-Konstruktion

  • Die Anführungszeichen am Anfang und Ende einer Zeichenfolge sollten sowohl doppelte als auch einfache Anführungszeichen sein. Sie können nicht gemischt werden.

  • Doppelte Anführungszeichen können in eine Zeichenfolge eingefügt werden, die mit einem einfachen Anführungszeichen beginnt und endet.

  • Ein einfaches Anführungszeichen kann in eine Zeichenfolge eingefügt werden, die mit doppelten Anführungszeichen beginnt und endet.

  • Doppelte Anführungszeichen können nicht in eine Zeichenfolge eingefügt werden, die mit doppelten Anführungszeichen beginnt und endet.

  • Ein einfaches Anführungszeichen kann nicht in eine Zeichenfolge eingefügt werden, die mit einem einfachen Anführungszeichen beginnt und endet.

Beispiele für gültige Zeichenfolgen

Die folgenden Beispiele erläutern die Regeln zum Erstellen einer Zeichenfolge in R.

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

Wenn der obige Code ausgeführt wird, erhalten wir die folgende Ausgabe:

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"

Beispiele für ungültige Zeichenfolgen

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

Wenn wir das Skript ausführen, schlägt es fehl, die folgenden Ergebnisse zu liefern.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

String-Manipulation

Strings verketten - Funktion paste ()

Viele Strings in R werden mit dem kombiniert paste()Funktion. Es kann eine beliebige Anzahl von Argumenten erforderlich sein, um miteinander kombiniert zu werden.

Syntax

Die grundlegende Syntax für die Einfügefunktion lautet -

paste(..., sep = " ", collapse = NULL)

Es folgt die Beschreibung der verwendeten Parameter -

  • ... repräsentiert eine beliebige Anzahl von Argumenten, die kombiniert werden sollen.

  • seprepräsentiert ein Trennzeichen zwischen den Argumenten. Es ist optional.

  • collapsewird verwendet, um den Abstand zwischen zwei Zeichenfolgen zu beseitigen. Aber nicht das Leerzeichen innerhalb von zwei Wörtern einer Zeichenfolge.

Beispiel

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

Formatieren von Zahlen und Zeichenfolgen - Funktion format ()

Zahlen und Zeichenfolgen können mit einem bestimmten Stil formatiert werden format() Funktion.

Syntax

Die grundlegende Syntax für die Formatfunktion lautet -

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

Es folgt die Beschreibung der verwendeten Parameter -

  • x ist die Vektoreingabe.

  • digits ist die Gesamtzahl der angezeigten Ziffern.

  • nsmall ist die Mindestanzahl von Stellen rechts vom Dezimalpunkt.

  • scientific wird auf TRUE gesetzt, um die wissenschaftliche Notation anzuzeigen.

  • width Gibt die Mindestbreite an, die am Anfang durch Auffüllen von Leerzeichen angezeigt werden soll.

  • justify ist die Anzeige der Zeichenfolge nach links, rechts oder in der Mitte.

Beispiel

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

Anzahl der Zeichen in einer string - nchar () - Funktion zählen

Diese Funktion zählt die Anzahl der Zeichen einschließlich Leerzeichen in einer Zeichenfolge.

Syntax

Die grundlegende Syntax für die Funktion nchar () lautet -

nchar(x)

Es folgt die Beschreibung der verwendeten Parameter -

  • x ist die Vektoreingabe.

Beispiel

result <- nchar("Count the number of characters")
print(result)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] 30

Ändern der Funktionen case - toupper () & tolower ()

Diese Funktionen ändern die Groß- und Kleinschreibung von Zeichen einer Zeichenfolge.

Syntax

Die grundlegende Syntax für die Funktion toupper () & tolower () lautet -

toupper(x)
tolower(x)

Es folgt die Beschreibung der verwendeten Parameter -

  • x ist die Vektoreingabe.

Beispiel

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] "CHANGING TO UPPER"
[1] "changing to lower"

Extrahieren von Teilen einer string - substring () - Funktion

Diese Funktion extrahiert Teile eines Strings.

Syntax

Die grundlegende Syntax für die Funktion substring () lautet -

substring(x,first,last)

Es folgt die Beschreibung der verwendeten Parameter -

  • x ist die Zeichenvektoreingabe.

  • first ist die Position des ersten zu extrahierenden Zeichens.

  • last ist die Position des zuletzt zu extrahierenden Zeichens.

Beispiel

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

Wenn wir den obigen Code ausführen, wird das folgende Ergebnis erzeugt:

[1] "act"