Эликсир - Сигилы

В этой главе мы собираемся изучить сигилы, механизмы, предоставляемые языком для работы с текстовыми представлениями. Сигилы начинаются с символа тильды (~), за которым следует буква (которая идентифицирует сигилу) и затем разделитель; необязательно, модификаторы могут быть добавлены после последнего разделителя.

Регулярное выражение

Регулярные выражения в Elixir - это сигилы. Мы видели их использование в главе о String. Давайте снова рассмотрим пример, чтобы увидеть, как мы можем использовать регулярное выражение в Elixir.

# A regular expression that matches strings which contain "foo" or
# "bar":
regex = ~r/foo|bar/
IO.puts("foo" =~ regex)
IO.puts("baz" =~ regex)

Когда вышеуказанная программа запускается, она дает следующий результат -

true
false

Сигилы поддерживают 8 различных разделителей -

~r/hello/
~r|hello|
~r"hello"
~r'hello'
~r(hello)
~r[hello]
~r{hello}
~r<hello>

Причина поддержки разных разделителей заключается в том, что разные разделители могут больше подходить для разных сигил. Например, использование круглых скобок для регулярных выражений может сбивать с толку, поскольку они могут смешиваться со скобками внутри регулярного выражения. Однако круглые скобки могут быть полезны для других сигил, как мы увидим в следующем разделе.

Elixir поддерживает регулярные выражения, совместимые с Perl, а также поддерживает модификаторы. Вы можете узнать больше об использовании регулярных выражений здесь .

Строки, списки символов и списки слов

Помимо регулярных выражений, в Elixir есть еще 3 встроенных сигилы. Давайте посмотрим на сигилы.

Струны

Сигил ~ s используется для генерации строк, как и двойные кавычки. Сигил ~ s полезен, например, когда строка содержит как двойные, так и одинарные кавычки -

new_string = ~s(this is a string with "double" quotes, not 'single' ones)
IO.puts(new_string)

Эта сигилла генерирует строки. Когда вышеуказанная программа запускается, она дает следующий результат -

"this is a string with \"double\" quotes, not 'single' ones"

Списки символов

Знак ~ c используется для создания списков символов -

new_char_list = ~c(this is a char list containing 'single quotes')
IO.puts(new_char_list)

Когда вышеуказанная программа запускается, она дает следующий результат -

this is a char list containing 'single quotes'

Списки слов

Сигил ~ w используется для создания списков слов (слова - это просто обычные строки). Внутри сигиллы ~ w слова разделяются пробелами.

new_word_list = ~w(foo bar bat)
IO.puts(new_word_list)

Когда вышеуказанная программа запускается, она дает следующий результат -

foobarbat

Символ ~ w также принимает c, s и a модификаторы (для списков символов, строк и атомов соответственно), которые определяют тип данных элементов результирующего списка -

new_atom_list = ~w(foo bar bat)a
IO.puts(new_atom_list)

Когда вышеуказанная программа запускается, она дает следующий результат -

[:foo, :bar, :bat]

Интерполяция и побег в сигилах

Помимо символов нижнего регистра, Elixir поддерживает символы верхнего регистра для работы с экранирующими символами и интерполяцией. Хотя и ~ s, и ~ S будут возвращать строки, первый допускает escape-коды и интерполяцию, а второй - нет. Давайте рассмотрим пример, чтобы понять это -

~s(String with escape codes \x26 #{"inter" <> "polation"})
# "String with escape codes & interpolation"
~S(String without escape codes \x26 without #{interpolation})
# "String without escape codes \\x26 without \#{interpolation}"

Пользовательские сигилы

Мы можем легко создать свои собственные сигилы. В этом примере мы создадим сигил для преобразования строки в верхний регистр.

defmodule CustomSigil do
   def sigil_u(string, []), do: String.upcase(string)
end

import CustomSigil

IO.puts(~u/tutorials point/)

Когда мы запускаем приведенный выше код, он дает следующий результат:

TUTORIALS POINT

Сначала мы определяем модуль под названием CustomSigil, и внутри этого модуля мы создали функцию под названием sigil_u. Поскольку в существующем пространстве сигил нет существующей сигилы ~ u, мы будем ее использовать. _U указывает, что мы хотим использовать u в качестве символа после тильды. Определение функции должно принимать два аргумента: вход и список.