Python 3 - ciągi
Ciągi znaków należą do najpopularniejszych typów w Pythonie. Możemy je tworzyć po prostu umieszczając znaki w cudzysłowach. Python traktuje pojedyncze cudzysłowy tak samo, jak podwójne cudzysłowy. Tworzenie ciągów jest tak proste, jak przypisanie wartości do zmiennej. Na przykład -
var1 = 'Hello World!'
var2 = "Python Programming"
Dostęp do wartości w ciągach
Python nie obsługuje typów znaków; są one traktowane jako ciągi o długości jeden, a zatem również traktowane jako podciąg.
Aby uzyskać dostęp do podciągów, użyj nawiasów kwadratowych do cięcia wraz z indeksem lub indeksami, aby uzyskać podciąg. Na przykład -
#!/usr/bin/python3
var1 = 'Hello World!'
var2 = "Python Programming"
print ("var1[0]: ", var1[0])
print ("var2[1:5]: ", var2[1:5])
Wykonanie powyższego kodu daje następujący wynik -
var1[0]: H
var2[1:5]: ytho
Aktualizowanie ciągów
Możesz „zaktualizować” istniejący ciąg poprzez (ponowne) przypisanie zmiennej do innego ciągu. Nowa wartość może być powiązana z jej poprzednią wartością lub zupełnie innym ciągiem. Na przykład -
#!/usr/bin/python3
var1 = 'Hello World!'
print ("Updated String :- ", var1[:6] + 'Python')
Wykonanie powyższego kodu daje następujący wynik -
Updated String :- Hello Python
Znaki ucieczki
Poniższa tabela zawiera listę znaków zmiany znaczenia lub znaków niedrukowalnych, które można przedstawić za pomocą notacji z ukośnikiem odwrotnym.
Znak ucieczki jest interpretowany; w ciągach pojedynczych i podwójnych cudzysłowów.
Notacja z ukośnikiem odwrotnym | Znak szesnastkowy | Opis |
---|---|---|
\za | 0x07 | Dzwonek lub alert |
\b | 0x08 | Backspace |
\ cx | Control + x | |
\ Cx | Control + x | |
\mi | 0x1b | Ucieczka |
\fa | 0x0c | Formfeed |
\ M- \ Cx | Meta-Control-x | |
\ n | 0x0a | Nowa linia |
\ nnn | Notacja ósemkowa, gdzie n mieści się w zakresie 0,7 | |
\ r | 0x0d | Powrót karetki |
\ s | 0x20 | Przestrzeń |
\ t | 0x09 | Patka |
\ v | 0x0b | Zakładka pionowa |
\ x | Postać x | |
\ xnn | Zapis szesnastkowy, gdzie n mieści się w zakresie 0,9, af lub AF |
Operatory specjalne łańcuchów
Załóż zmienną łańcuchową a zawiera „Hello” i zmienną b zawiera „Python”, a następnie -
Operator | Opis | Przykład |
---|---|---|
+ | Konkatenacja - dodaje wartości po obu stronach operatora | a + b da HelloPython |
* | Powtórzenie - tworzy nowe ciągi, łącząc wiele kopii tego samego ciągu | a * 2 da -HelloHello |
[] | Slice - podaje znak z podanego indeksu | a [1] da e |
[:] | Fragment zakresu - podaje znaki z podanego zakresu | a [1: 4] da łokieć |
w | Członkostwo - zwraca wartość true, jeśli znak istnieje w podanym ciągu | H w a da 1 |
nie w | Członkostwo - zwraca wartość true, jeśli znak nie istnieje w podanym ciągu | M nie da 1 |
r / R | Surowy ciąg - pomija rzeczywiste znaczenie znaków ucieczki. Składnia nieprzetworzonych łańcuchów jest dokładnie taka sama, jak w przypadku zwykłych ciągów, z wyjątkiem surowego operatora łańcucha, litery „r”, która poprzedza cudzysłowy. Litera „r” może być małą (r) lub wielką (R) i musi zostać umieszczona bezpośrednio przed pierwszym cudzysłowem. | print r '\ n' drukuje \ n i print R '\ n'prints \ n |
% | Format - wykonuje formatowanie ciągów | Zobacz w następnej sekcji |
Operator formatowania łańcucha
Jedną z najfajniejszych funkcji Pythona jest operator formatu ciągu znaków%. Ten operator jest unikalny dla łańcuchów i stanowi pakiet funkcji z rodziny printf () języka C. Oto prosty przykład -
#!/usr/bin/python3
print ("My name is %s and weight is %d kg!" % ('Zara', 21))
Wykonanie powyższego kodu daje następujący wynik -
My name is Zara and weight is 21 kg!
Oto lista pełnego zestawu symboli, których można używać wraz z% -
Sr.No. | Symbol formatu i konwersja |
---|---|
1 | %c postać |
2 | %s konwersja ciągów przez str () przed formatowaniem |
3 | %i liczba całkowita dziesiętna ze znakiem |
4 | %d liczba całkowita dziesiętna ze znakiem |
5 | %u liczba całkowita dziesiętna bez znaku |
6 | %o ósemkowa liczba całkowita |
7 | %x liczba szesnastkowa całkowita (małe litery) |
8 | %X liczba szesnastkowa całkowita (wielkie litery) |
9 | %e notacja wykładnicza (z małą literą „e”) |
10 | %E notacja wykładnicza (z WIELKĄ LITERĄ „E”) |
11 | %f zmiennoprzecinkowa liczba rzeczywista |
12 | %g krótszy z% f i% e |
13 | %G krótszy z% f i% E |
Inne obsługiwane symbole i funkcje są wymienione w poniższej tabeli -
Sr.No. | Symbol i funkcjonalność |
---|---|
1 | * argument określa szerokość lub precyzję |
2 | - lewe uzasadnienie |
3 | + wyświetlić znak |
4 | <sp> pozostaw puste miejsce przed liczbą dodatnią |
5 | # dodaj wiodące zero ósemkowe („0”) lub wiodące szesnastkowe „0x” lub „0X”, w zależności od tego, czy użyto „x” czy „X”. |
6 | 0 wypełnij od lewej zerami (zamiast spacji) |
7 | % „%%” pozostawia pojedynczy literał „%” |
8 | (var) mapowanie zmiennej (argumenty słownikowe) |
9 | m.n. m to minimalna całkowita szerokość, an to liczba cyfr wyświetlanych po przecinku (jeśli ma to zastosowanie). |
Potrójne cytaty
Potrójne cudzysłowy w Pythonie przychodzą na ratunek, umożliwiając ciągom tekstowym obejmowanie wielu wierszy, w tym dosłowne znaki NEWLINE, TAB i wszelkie inne znaki specjalne.
Składnia potrójnych cudzysłowów składa się z trzech następujących po sobie single or double cytaty.
#!/usr/bin/python3
para_str = """this is a long string that is made up of
several lines and non-printable characters such as
TAB ( \t ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [ \n ], or just a NEWLINE within
the variable assignment will also show up.
"""
print (para_str)
Wykonanie powyższego kodu daje następujący wynik. Zwróć uwagę, jak każdy pojedynczy znak specjalny został przekonwertowany do postaci drukowanej, aż do ostatniego znaku NEWLINE na końcu ciągu między znakiem „w górę”. i zamykające potrójne cudzysłowy. Należy również zauważyć, że znaki NEWLINE występują albo z jawnym powrotem karetki na końcu wiersza, albo z jego kodem ucieczki (\ n) -
this is a long string that is made up of
several lines and non-printable characters such as
TAB ( ) and they will show up that way when displayed.
NEWLINEs within the string, whether explicitly given like
this within the brackets [
], or just a NEWLINE within
the variable assignment will also show up.
Nieprzetworzone łańcuchy w ogóle nie traktują ukośnika odwrotnego jako znaku specjalnego. Każdy znak, który umieścisz w nieprzetworzonym łańcuchu, pozostaje taki, jaki został napisany -
#!/usr/bin/python3
print ('C:\\nowhere')
Wykonanie powyższego kodu daje następujący wynik -
C:\nowhere
Skorzystajmy teraz z surowego łańcucha. Włożylibyśmy wyrazr'expression' w następujący sposób -
#!/usr/bin/python3
print (r'C:\\nowhere')
Wykonanie powyższego kodu daje następujący wynik -
C:\\nowhere
Ciąg Unicode
W Pythonie 3 wszystkie łańcuchy są reprezentowane w Unicode, w Pythonie 2 są przechowywane wewnętrznie jako 8-bitowe ASCII, dlatego wymagane jest dołączenie litery `` u '', aby uzyskać Unicode. Nie jest to już konieczne.
Wbudowane metody łańcuchowe
Python zawiera następujące wbudowane metody do manipulowania ciągami znaków -
Sr.No. | Metody i opis |
---|---|
1 | skapitalizować() Zamienia pierwszą literę ciągu na wielką literę |
2 | środek (szerokość, znak wypełnienia) Zwraca ciąg wypełniony znakiem fillchar z oryginalnym ciągiem wyśrodkowanym do łącznej szerokości kolumn. |
3 | count (str, beg = 0, end = len (string)) Oblicza, ile razy str występuje w ciągu lub w podłańcuchu ciągu, jeśli podano początkowy indeks początkowy i końcowy indeks końcowy. |
4 | dekodować (kodowanie = „UTF-8”, błędy = „ścisłe”) Dekoduje ciąg przy użyciu kodeka zarejestrowanego do kodowania. encoding domyślnie na domyślne kodowanie ciągów. |
5 | encode (kodowanie = „UTF-8”, błędy = „ścisłe”) Zwraca zakodowaną wersję ciągu znaków; w przypadku błędu domyślnie zgłaszany jest błąd ValueError, chyba że dla błędu podano „ignoruj” lub „zamień”. |
6 | endwith (sufiks, początek = 0, koniec = len (ciąg)) Określa, czy łańcuch lub podłańcuch łańcucha (jeśli podano początek indeksu początek i koniec indeksu koniec) kończy się sufiksem; zwraca prawdę, jeśli tak, i fałsz w przeciwnym razie. |
7 | expandtabs (tabsize = 8) Rozwija tabulatory w łańcuchu do wielu spacji; domyślnie 8 spacji na kartę, jeśli nie podano rozmiaru tabulacji. |
8 | find (str, beg = 0 end = len (string)) Określić, czy str występuje w łańcuchu lub w podłańcuchu łańcucha, jeśli podano indeks początkowy początek i koniec indeksu, zwraca indeks, jeśli zostanie znaleziony, a -1 w przeciwnym razie. |
9 | index (str, beg = 0, end = len (string)) To samo, co find (), ale zgłasza wyjątek, jeśli nie znaleziono ciągu. |
10 | isalnum () Zwraca wartość true, jeśli łańcuch ma co najmniej 1 znak, a wszystkie znaki są alfanumeryczne, aw przeciwnym razie - fałsz. |
11 | isalpha () Zwraca wartość true, jeśli łańcuch ma co najmniej 1 znak, a wszystkie znaki są alfabetyczne, aw przeciwnym razie - fałsz. |
12 | isdigit () Zwraca true, jeśli ciąg zawiera tylko cyfry, lub false, jeśli jest inaczej. |
13 | islower () Zwraca wartość true, jeśli łańcuch ma co najmniej 1 znak wielkości liter, a wszystkie znaki wielkości liter są zapisane małymi literami, aw przeciwnym razie - fałsz. |
14 | isnumeric () Zwraca wartość true, jeśli ciąg znaków Unicode zawiera tylko znaki numeryczne, lub false, jeśli jest inaczej. |
15 | isspace () Zwraca wartość true, jeśli ciąg zawiera tylko białe znaki, lub false, jeśli jest inaczej. |
16 | istitle () Zwraca wartość „prawda”, jeśli ciąg znaków zawiera poprawnie „tytuł”, a fałsz, jeśli jest inaczej. |
17 | isupper () Zwraca wartość true, jeśli łańcuch ma co najmniej jeden znak wielkości liter, a wszystkie znaki wielkości liter są duże, aw przeciwnym razie - fałsz. |
18 | dołącz (kolejność) Łączy (łączy) ciągi reprezentujące elementy w sekwencji sekwencyjnej w ciąg z ciągiem separującym. |
19 | len (ciąg) Zwraca długość ciągu |
20 | ljust (width [, fillchar]) Zwraca ciąg uzupełniony spacjami z oryginalnym ciągiem wyrównanym do lewej do łącznej szerokości kolumn. |
21 | niższy() Konwertuje wszystkie wielkie litery w ciągu na małe litery. |
22 | lstrip () Usuwa wszystkie wiodące spacje w ciągu. |
23 | maketrans () Zwraca tabelę tłumaczeń do użycia w funkcji tłumaczenia. |
24 | max (str) Zwraca maksymalny znak alfabetyczny z łańcucha str. |
25 | min (str) Zwraca min znak alfabetyczny z ciągu str. |
26 | zastąp (stary, nowy [, maks.]) Zastępuje wszystkie wystąpienia starego w łańcuchu nowymi lub co najwyżej max wystąpieniami, jeśli podano max. |
27 | rfind (str, beg = 0, end = len (string)) To samo, co find (), ale przeszukuje wstecz w ciągu. |
28 | rindex (str, beg = 0, end = len (string)) To samo co index (), ale przeszukuje wstecz w ciągu. |
29 | rjust (width, [, fillchar]) Zwraca ciąg uzupełniony spacjami z oryginalnym ciągiem wyrównanym do prawej do łącznej szerokości kolumn. |
30 | rstrip () Usuwa wszystkie końcowe spacje ciągu. |
31 | split (str = "", num = string.count (str)) Dzieli łańcuch według separatora (spacja, jeśli nie podano) i zwraca listę podciągów; podziel na co najwyżej num podciągów, jeśli podano. |
32 | splitlines (num = string.count ('\ n')) Dzieli ciąg na wszystkich (lub w liczbie) NEWLINEs i zwraca listę wszystkich wierszy z usuniętymi NEWLINEs. |
33 | beginwith (str, beg = 0, end = len (string)) Określa, czy łańcuch lub podłańcuch łańcucha (jeśli podano początkowy indeks początkowy i końcowy indeks końcowy) zaczyna się od podłańcucha str; zwraca prawdę, jeśli tak, i fałsz w przeciwnym razie. |
34 | strip ([znaki]) Wykonuje na łańcuchu zarówno lstrip (), jak i rstrip () |
35 | swapcase () Odwraca wielkość liter dla wszystkich liter w ciągu. |
36 | tytuł() Zwraca wersję ciągu oznaczoną „tytułem”, czyli wszystkie słowa zaczynają się od wielkich liter, a pozostałe są małymi literami. |
37 | przetłumacz (tabela, deletechars = "") Tłumaczy ciąg zgodnie z tabelą translacji str (256 znaków), usuwając te z łańcucha del. |
38 | górny() Konwertuje małe litery w ciągu na duże. |
39 | zfill (szerokość) Zwraca oryginalny łańcuch z odstępami zerowymi do całkowitej liczby znaków szerokości; przeznaczona dla liczb, zfill () zachowuje każdy podany znak (pomniejszony o jedno zero). |
40 | isdecimal () Zwraca wartość true, jeśli ciąg znaków Unicode zawiera tylko znaki dziesiętne, lub false, jeśli jest inaczej. |