Gấu trúc Python - Dòng
Chuỗi là mảng có nhãn một chiều có khả năng chứa dữ liệu thuộc bất kỳ kiểu nào (đối tượng số nguyên, chuỗi, float, python, v.v.). Các nhãn trục được gọi chung là chỉ mục.
gấu trúc.Series
Có thể tạo Dòng gấu trúc bằng cách sử dụng hàm tạo sau:
pandas.Series( data, index, dtype, copy)
Các tham số của hàm tạo như sau:
Sr.No | Mô tả về Thông Số |
---|---|
1 | data dữ liệu có nhiều dạng khác nhau như ndarray, danh sách, hằng số |
2 | index Giá trị chỉ mục phải là duy nhất và có thể băm, cùng độ dài với dữ liệu. Mặc địnhnp.arrange(n) nếu không có chỉ mục nào được thông qua. |
3 | dtype dtype dành cho kiểu dữ liệu. Nếu Không, kiểu dữ liệu sẽ được suy ra |
4 | copy Sao chép dữ liệu. Sai mặc định |
Một chuỗi có thể được tạo bằng các đầu vào khác nhau như -
- Array
- Dict
- Giá trị vô hướng hoặc hằng số
Tạo một chuỗi trống
Một loạt cơ bản, có thể được tạo là một loạt trống.
Thí dụ
#import the pandas library and aliasing as pd
import pandas as pd
s = pd.Series()
print s
Nó là output như sau -
Series([], dtype: float64)
Tạo một chuỗi từ ndarray
Nếu dữ liệu là một mảng ndarray, thì chỉ mục được truyền phải có cùng độ dài. Nếu không có chỉ mục nào được thông qua, thì theo mặc định, chỉ mục sẽ làrange(n) Ở đâu n là độ dài mảng, tức là, [0,1,2,3…. range(len(array))-1].
ví dụ 1
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data)
print s
Nó là output như sau -
0 a
1 b
2 c
3 d
dtype: object
Chúng tôi đã không chuyển bất kỳ chỉ mục nào, vì vậy theo mặc định, nó đã gán các chỉ mục từ 0 đến len(data)-1, tức là, 0 đến 3.
Ví dụ 2
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = np.array(['a','b','c','d'])
s = pd.Series(data,index=[100,101,102,103])
print s
Nó là output như sau -
100 a
101 b
102 c
103 d
dtype: object
Chúng tôi đã chuyển các giá trị chỉ mục ở đây. Bây giờ chúng ta có thể thấy các giá trị được lập chỉ mục tùy chỉnh trong đầu ra.
Tạo một chuỗi từ dict
A dictcó thể được chuyển dưới dạng đầu vào và nếu không có chỉ mục nào được chỉ định, thì các khóa từ điển được lấy theo thứ tự được sắp xếp để tạo chỉ mục. Nếuindex được chuyển, các giá trị trong dữ liệu tương ứng với các nhãn trong chỉ mục sẽ được lấy ra.
ví dụ 1
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data)
print s
Nó là output như sau -
a 0.0
b 1.0
c 2.0
dtype: float64
Observe - Các khóa từ điển được sử dụng để xây dựng chỉ mục.
Ví dụ 2
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
data = {'a' : 0., 'b' : 1., 'c' : 2.}
s = pd.Series(data,index=['b','c','d','a'])
print s
Nó là output như sau -
b 1.0
c 2.0
d NaN
a 0.0
dtype: float64
Observe - Thứ tự chỉ mục được duy trì và phần tử bị thiếu được điền bằng NaN (Không phải là Số).
Tạo một chuỗi từ Scalar
Nếu dữ liệu là một giá trị vô hướng, một chỉ mục phải được cung cấp. Giá trị sẽ được lặp lại để khớp với độ dài củaindex
#import the pandas library and aliasing as pd
import pandas as pd
import numpy as np
s = pd.Series(5, index=[0, 1, 2, 3])
print s
Nó là output như sau -
0 5
1 5
2 5
3 5
dtype: int64
Truy cập dữ liệu từ chuỗi có vị trí
Dữ liệu trong chuỗi có thể được truy cập tương tự như trong ndarray.
ví dụ 1
Truy xuất phần tử đầu tiên. Như chúng ta đã biết, việc đếm bắt đầu từ 0 cho mảng, có nghĩa là phần tử đầu tiên được lưu trữ ở vị trí thứ 0 , v.v.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the first element
print s[0]
Nó là output như sau -
1
Ví dụ 2
Truy xuất ba phần tử đầu tiên trong Chuỗi. Nếu một: được chèn trước nó, tất cả các mục từ chỉ mục đó trở đi sẽ được trích xuất. Nếu hai tham số (với: giữa chúng) được sử dụng, các mục giữa hai chỉ mục (không bao gồm chỉ mục dừng)
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the first three element
print s[:3]
Nó là output như sau -
a 1
b 2
c 3
dtype: int64
Ví dụ 3
Truy xuất ba phần tử cuối cùng.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve the last three element
print s[-3:]
Nó là output như sau -
c 3
d 4
e 5
dtype: int64
Lấy dữ liệu bằng cách sử dụng nhãn (chỉ mục)
A Series giống như một kích thước cố định dict trong đó bạn có thể lấy và đặt giá trị theo nhãn chỉ mục.
ví dụ 1
Truy xuất một phần tử đơn lẻ bằng giá trị nhãn chỉ mục.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve a single element
print s['a']
Nó là output như sau -
1
Ví dụ 2
Truy xuất nhiều phần tử bằng cách sử dụng danh sách các giá trị nhãn chỉ mục.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve multiple elements
print s[['a','c','d']]
Nó là output như sau -
a 1
c 3
d 4
dtype: int64
Ví dụ 3
Nếu một nhãn không được chứa, một ngoại lệ sẽ được đưa ra.
import pandas as pd
s = pd.Series([1,2,3,4,5],index = ['a','b','c','d','e'])
#retrieve multiple elements
print s['f']
Nó là output như sau -
…
KeyError: 'f'