R - струны

Любое значение, записанное в одинарных или двойных кавычках в R, рассматривается как строка. Внутри R хранит каждую строку в двойных кавычках, даже если вы создаете их с одинарными кавычками.

Правила, применяемые при построении струн

  • Кавычки в начале и в конце строки должны быть как двойными, так и одинарными. Их нельзя смешивать.

  • Двойные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

  • Одинарные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся двойными кавычками.

  • Двойные кавычки нельзя вставлять в строку, начинающуюся и заканчивающуюся двойными кавычками.

  • Одиночные кавычки нельзя вставлять в строку, начинающуюся и заканчивающуюся одинарной кавычкой.

Примеры действительных строк

Следующие примеры поясняют правила создания строки в R.

a <- 'Start and end with single quote'
print(a)

b <- "Start and end with double quotes"
print(b)

c <- "single quote ' in between double quotes"
print(c)

d <- 'Double quotes " in between single quote'
print(d)

Когда приведенный выше код запускается, мы получаем следующий вывод -

[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"

Примеры неверных строк

e <- 'Mixed quotes" 
print(e)

f <- 'Single quote ' inside single quote'
print(f)

g <- "Double quotes " inside double quotes"
print(g)

Когда мы запускаем скрипт, он не дает результатов ниже.

Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted

Манипуляции со строками

Объединение строк - функция paste ()

Многие строки в R объединяются с помощью paste()функция. Для объединения вместе может потребоваться любое количество аргументов.

Синтаксис

Основной синтаксис для функции вставки -

paste(..., sep = " ", collapse = NULL)

Ниже приводится описание используемых параметров -

  • ... представляет любое количество объединяемых аргументов.

  • sepпредставляет собой любой разделитель между аргументами. Это необязательно.

  • collapseиспользуется для устранения пробелов между двумя строками. Но не пробел в двух словах одной строки.

пример

a <- "Hello"
b <- 'How'
c <- "are you? "

print(paste(a,b,c))

print(paste(a,b,c, sep = "-"))

print(paste(a,b,c, sep = "", collapse = ""))

Когда мы выполняем приведенный выше код, он дает следующий результат:

[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "

Форматирование чисел и строк - функция format ()

Числа и строки можно отформатировать в соответствии с определенным стилем, используя format() функция.

Синтаксис

Основной синтаксис функции форматирования -

format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))

Ниже приводится описание используемых параметров -

  • x - векторный вход.

  • digits - общее количество отображаемых цифр.

  • nsmall - минимальное количество цифр справа от десятичной точки.

  • scientific установлено значение TRUE для отображения экспоненциальной записи.

  • width указывает минимальную ширину, которая должна отображаться пробелами в начале.

  • justify это отображение строки слева, справа или по центру.

пример

# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)

# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)

# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)

# Format treats everything as a string.
result <- format(6)
print(result)

# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)

# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)

# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат:

[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] "  13.7"
[1] "Hello   "
[1] " Hello  "

Подсчет количества символов в строке - функция nchar ()

Эта функция подсчитывает количество символов, включая пробелы, в строке.

Синтаксис

Основной синтаксис для функции nchar () -

nchar(x)

Ниже приводится описание используемых параметров -

  • x - векторный вход.

пример

result <- nchar("Count the number of characters")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат:

[1] 30

Изменение регистра - функции toupper () и tolower ()

Эти функции изменяют регистр символов в строке.

Синтаксис

Базовый синтаксис функций toupper () и tolower () -

toupper(x)
tolower(x)

Ниже приводится описание используемых параметров -

  • x - векторный вход.

пример

# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)

# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат:

[1] "CHANGING TO UPPER"
[1] "changing to lower"

Извлечение частей строки - функция substring ()

Эта функция извлекает части строки.

Синтаксис

Базовый синтаксис функции substring () -

substring(x,first,last)

Ниже приводится описание используемых параметров -

  • x - ввод вектора символов.

  • first это позиция первого извлекаемого символа.

  • last это позиция последнего извлекаемого символа.

пример

# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)

Когда мы выполняем приведенный выше код, он дает следующий результат:

[1] "act"