R - струны
Любое значение, записанное в одинарных или двойных кавычках в R, рассматривается как строка. Внутри R хранит каждую строку в двойных кавычках, даже если вы создаете их с одинарными кавычками.
Правила, применяемые при построении струн
Кавычки в начале и в конце строки должны быть как двойными, так и одинарными. Их нельзя смешивать.
Двойные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся одинарной кавычкой.
Одинарные кавычки могут быть вставлены в строку, начинающуюся и заканчивающуюся двойными кавычками.
Двойные кавычки нельзя вставлять в строку, начинающуюся и заканчивающуюся двойными кавычками.
Одиночные кавычки нельзя вставлять в строку, начинающуюся и заканчивающуюся одинарной кавычкой.
Примеры действительных строк
Следующие примеры поясняют правила создания строки в R.
a <- 'Start and end with single quote'
print(a)
b <- "Start and end with double quotes"
print(b)
c <- "single quote ' in between double quotes"
print(c)
d <- 'Double quotes " in between single quote'
print(d)
Когда приведенный выше код запускается, мы получаем следующий вывод -
[1] "Start and end with single quote"
[1] "Start and end with double quotes"
[1] "single quote ' in between double quote"
[1] "Double quote \" in between single quote"
Примеры неверных строк
e <- 'Mixed quotes"
print(e)
f <- 'Single quote ' inside single quote'
print(f)
g <- "Double quotes " inside double quotes"
print(g)
Когда мы запускаем скрипт, он не дает результатов ниже.
Error: unexpected symbol in:
"print(e)
f <- 'Single"
Execution halted
Манипуляции со строками
Объединение строк - функция paste ()
Многие строки в R объединяются с помощью paste()функция. Для объединения вместе может потребоваться любое количество аргументов.
Синтаксис
Основной синтаксис для функции вставки -
paste(..., sep = " ", collapse = NULL)
Ниже приводится описание используемых параметров -
... представляет любое количество объединяемых аргументов.
sepпредставляет собой любой разделитель между аргументами. Это необязательно.
collapseиспользуется для устранения пробелов между двумя строками. Но не пробел в двух словах одной строки.
пример
a <- "Hello"
b <- 'How'
c <- "are you? "
print(paste(a,b,c))
print(paste(a,b,c, sep = "-"))
print(paste(a,b,c, sep = "", collapse = ""))
Когда мы выполняем приведенный выше код, он дает следующий результат:
[1] "Hello How are you? "
[1] "Hello-How-are you? "
[1] "HelloHoware you? "
Форматирование чисел и строк - функция format ()
Числа и строки можно отформатировать в соответствии с определенным стилем, используя format() функция.
Синтаксис
Основной синтаксис функции форматирования -
format(x, digits, nsmall, scientific, width, justify = c("left", "right", "centre", "none"))
Ниже приводится описание используемых параметров -
x - векторный вход.
digits - общее количество отображаемых цифр.
nsmall - минимальное количество цифр справа от десятичной точки.
scientific установлено значение TRUE для отображения экспоненциальной записи.
width указывает минимальную ширину, которая должна отображаться пробелами в начале.
justify это отображение строки слева, справа или по центру.
пример
# Total number of digits displayed. Last digit rounded off.
result <- format(23.123456789, digits = 9)
print(result)
# Display numbers in scientific notation.
result <- format(c(6, 13.14521), scientific = TRUE)
print(result)
# The minimum number of digits to the right of the decimal point.
result <- format(23.47, nsmall = 5)
print(result)
# Format treats everything as a string.
result <- format(6)
print(result)
# Numbers are padded with blank in the beginning for width.
result <- format(13.7, width = 6)
print(result)
# Left justify strings.
result <- format("Hello", width = 8, justify = "l")
print(result)
# Justfy string with center.
result <- format("Hello", width = 8, justify = "c")
print(result)
Когда мы выполняем приведенный выше код, он дает следующий результат:
[1] "23.1234568"
[1] "6.000000e+00" "1.314521e+01"
[1] "23.47000"
[1] "6"
[1] " 13.7"
[1] "Hello "
[1] " Hello "
Подсчет количества символов в строке - функция nchar ()
Эта функция подсчитывает количество символов, включая пробелы, в строке.
Синтаксис
Основной синтаксис для функции nchar () -
nchar(x)
Ниже приводится описание используемых параметров -
x - векторный вход.
пример
result <- nchar("Count the number of characters")
print(result)
Когда мы выполняем приведенный выше код, он дает следующий результат:
[1] 30
Изменение регистра - функции toupper () и tolower ()
Эти функции изменяют регистр символов в строке.
Синтаксис
Базовый синтаксис функций toupper () и tolower () -
toupper(x)
tolower(x)
Ниже приводится описание используемых параметров -
x - векторный вход.
пример
# Changing to Upper case.
result <- toupper("Changing To Upper")
print(result)
# Changing to lower case.
result <- tolower("Changing To Lower")
print(result)
Когда мы выполняем приведенный выше код, он дает следующий результат:
[1] "CHANGING TO UPPER"
[1] "changing to lower"
Извлечение частей строки - функция substring ()
Эта функция извлекает части строки.
Синтаксис
Базовый синтаксис функции substring () -
substring(x,first,last)
Ниже приводится описание используемых параметров -
x - ввод вектора символов.
first это позиция первого извлекаемого символа.
last это позиция последнего извлекаемого символа.
пример
# Extract characters from 5th to 7th position.
result <- substring("Extract", 5, 7)
print(result)
Когда мы выполняем приведенный выше код, он дает следующий результат:
[1] "act"