Gấu trúc Python - Chức năng cơ bản

Bây giờ, chúng ta đã tìm hiểu về ba Cấu trúc Dữ liệu của Gấu trúc và cách tạo chúng. Chúng tôi sẽ chủ yếu tập trung vào các đối tượng DataFrame vì tầm quan trọng của nó trong việc xử lý dữ liệu thời gian thực và cũng thảo luận về một số Cấu trúc dữ liệu khác.

Chức năng cơ bản của dòng

Sr.No. Thuộc tính hoặc Phương pháp & Mô tả
1

axes

Trả về danh sách các nhãn trục hàng

2

dtype

Trả về kiểu của đối tượng.

3

empty

Trả về True nếu chuỗi trống.

4

ndim

Trả về số thứ nguyên của dữ liệu cơ bản, theo định nghĩa 1.

5

size

Trả về số phần tử trong dữ liệu cơ bản.

6

values

Trả về Chuỗi dưới dạng ndarray.

7

head()

Trả về n hàng đầu tiên.

số 8

tail()

Trả về n hàng cuối cùng.

Bây giờ chúng ta hãy tạo một Chuỗi và xem tất cả hoạt động thuộc tính được lập bảng ở trên.

Thí dụ

import pandas as pd
import numpy as np

#Create a series with 100 random numbers
s = pd.Series(np.random.randn(4))
print s

Nó là output như sau -

0   0.967853
1  -0.148368
2  -1.395906
3  -1.758394
dtype: float64

rìu

Trả về danh sách các nhãn của chuỗi.

import pandas as pd
import numpy as np

#Create a series with 100 random numbers
s = pd.Series(np.random.randn(4))
print ("The axes are:")
print s.axes

Nó là output như sau -

The axes are:
[RangeIndex(start=0, stop=4, step=1)]

Kết quả trên là một định dạng nhỏ gọn của danh sách các giá trị từ 0 đến 5, tức là, [0,1,2,3,4].

trống

Trả về giá trị Boolean cho biết Đối tượng có trống hay không. True chỉ ra rằng đối tượng trống.

import pandas as pd
import numpy as np

#Create a series with 100 random numbers
s = pd.Series(np.random.randn(4))
print ("Is the Object empty?")
print s.empty

Nó là output như sau -

Is the Object empty?
False

ndim

Trả về số kích thước của đối tượng. Theo định nghĩa, Chuỗi là cấu trúc dữ liệu 1D, vì vậy nó trả về

import pandas as pd
import numpy as np

#Create a series with 4 random numbers
s = pd.Series(np.random.randn(4))
print s

print ("The dimensions of the object:")
print s.ndim

Nó là output như sau -

0   0.175898
1   0.166197
2  -0.609712
3  -1.377000
dtype: float64

The dimensions of the object:
1

kích thước

Trả về kích thước (chiều dài) của chuỗi.

import pandas as pd
import numpy as np

#Create a series with 4 random numbers
s = pd.Series(np.random.randn(2))
print s
print ("The size of the object:")
print s.size

Nó là output như sau -

0   3.078058
1  -1.207803
dtype: float64

The size of the object:
2

giá trị

Trả về dữ liệu thực tế trong chuỗi dưới dạng mảng.

import pandas as pd
import numpy as np

#Create a series with 4 random numbers
s = pd.Series(np.random.randn(4))
print s

print ("The actual data series is:")
print s.values

Nó là output như sau -

0   1.787373
1  -0.605159
2   0.180477
3  -0.140922
dtype: float64

The actual data series is:
[ 1.78737302 -0.60515881 0.18047664 -0.1409218 ]

Đầu & Đuôi

Để xem một mẫu nhỏ của một Chuỗi hoặc đối tượng DataFrame, hãy sử dụng phương thức head () và tail ().

head() trả về cái đầu tiên nhàng (quan sát các giá trị chỉ số). Số phần tử mặc định để hiển thị là năm phần tử, nhưng bạn có thể chuyển một số tùy chỉnh.

import pandas as pd
import numpy as np

#Create a series with 4 random numbers
s = pd.Series(np.random.randn(4))
print ("The original series is:")
print s

print ("The first two rows of the data series:")
print s.head(2)

Nó là output như sau -

The original series is:
0   0.720876
1  -0.765898
2   0.479221
3  -0.139547
dtype: float64

The first two rows of the data series:
0   0.720876
1  -0.765898
dtype: float64

tail() trả về cuối cùng nhàng (quan sát các giá trị chỉ số). Số phần tử mặc định để hiển thị là năm phần tử, nhưng bạn có thể chuyển một số tùy chỉnh.

import pandas as pd
import numpy as np

#Create a series with 4 random numbers
s = pd.Series(np.random.randn(4))
print ("The original series is:")
print s

print ("The last two rows of the data series:")
print s.tail(2)

Nó là output như sau -

The original series is:
0 -0.655091
1 -0.881407
2 -0.608592
3 -2.341413
dtype: float64

The last two rows of the data series:
2 -0.608592
3 -2.341413
dtype: float64

Chức năng cơ bản của DataFrame

Bây giờ chúng ta hãy hiểu Chức năng Cơ bản của DataFrame là gì. Các bảng sau liệt kê các thuộc tính hoặc phương pháp quan trọng trợ giúp trong Chức năng Cơ bản của DataFrame.

Sr.No. Thuộc tính hoặc Phương pháp & Mô tả
1

T

Chuyển đổi các hàng và cột.

2

axes

Trả về danh sách có nhãn trục hàng và nhãn trục cột là thành viên duy nhất.

3

dtypes

Trả về các kiểu trong đối tượng này.

4

empty

Đúng nếu NDFrame hoàn toàn trống [không có mục]; nếu bất kỳ trục nào có độ dài bằng 0.

5

ndim

Số trục / kích thước mảng.

6

shape

Trả về một bộ giá trị đại diện cho kích thước của DataFrame.

7

size

Số phần tử trong NDFrame.

số 8

values

Đại diện khó hiểu của NDFrame.

9

head()

Trả về n hàng đầu tiên.

10

tail()

Trả về n hàng cuối cùng.

Bây giờ chúng ta hãy tạo một DataFrame và xem tất cả cách hoạt động của các thuộc tính được đề cập ở trên.

Thí dụ

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

#Create a DataFrame
df = pd.DataFrame(d)
print ("Our data series is:")
print df

Nó là output như sau -

Our data series is:
    Age   Name    Rating
0   25    Tom     4.23
1   26    James   3.24
2   25    Ricky   3.98
3   23    Vin     2.56
4   30    Steve   3.20
5   29    Smith   4.60
6   23    Jack    3.80

T (Transpose)

Trả về chuyển vị của DataFrame. Các hàng và cột sẽ hoán đổi cho nhau.

import pandas as pd
import numpy as np
 
# Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

# Create a DataFrame
df = pd.DataFrame(d)
print ("The transpose of the data series is:")
print df.T

Nó là output như sau -

The transpose of the data series is:
         0     1       2      3      4      5       6
Age      25    26      25     23     30     29      23
Name     Tom   James   Ricky  Vin    Steve  Smith   Jack
Rating   4.23  3.24    3.98   2.56   3.2    4.6     3.8

rìu

Trả về danh sách các nhãn trục hàng và nhãn trục cột.

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

#Create a DataFrame
df = pd.DataFrame(d)
print ("Row axis labels and column axis labels are:")
print df.axes

Nó là output như sau -

Row axis labels and column axis labels are:

[RangeIndex(start=0, stop=7, step=1), Index([u'Age', u'Name', u'Rating'],
dtype='object')]

dtypes

Trả về kiểu dữ liệu của mỗi cột.

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

#Create a DataFrame
df = pd.DataFrame(d)
print ("The data types of each column are:")
print df.dtypes

Nó là output như sau -

The data types of each column are:
Age     int64
Name    object
Rating  float64
dtype: object

trống

Trả về giá trị Boolean cho biết Đối tượng có trống hay không; True chỉ ra rằng đối tượng trống.

import pandas as pd
import numpy as np
 
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 
#Create a DataFrame
df = pd.DataFrame(d)
print ("Is the object empty?")
print df.empty

Nó là output như sau -

Is the object empty?
False

ndim

Trả về số kích thước của đối tượng. Theo định nghĩa, DataFrame là một đối tượng 2D.

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

#Create a DataFrame
df = pd.DataFrame(d)
print ("Our object is:")
print df
print ("The dimension of the object is:")
print df.ndim

Nó là output như sau -

Our object is:
      Age    Name     Rating
0     25     Tom      4.23
1     26     James    3.24
2     25     Ricky    3.98
3     23     Vin      2.56
4     30     Steve    3.20
5     29     Smith    4.60
6     23     Jack     3.80

The dimension of the object is:
2

hình dạng

Trả về một bộ giá trị đại diện cho kích thước của DataFrame. Tuple (a, b), trong đó a đại diện cho số hàng vàb đại diện cho số lượng cột.

import pandas as pd
import numpy as np
 
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 
#Create a DataFrame
df = pd.DataFrame(d)
print ("Our object is:")
print df
print ("The shape of the object is:")
print df.shape

Nó là output như sau -

Our object is:
   Age   Name    Rating
0  25    Tom     4.23
1  26    James   3.24
2  25    Ricky   3.98
3  23    Vin     2.56
4  30    Steve   3.20
5  29    Smith   4.60
6  23    Jack    3.80

The shape of the object is:
(7, 3)

kích thước

Trả về số phần tử trong DataFrame.

import pandas as pd
import numpy as np
 
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 
#Create a DataFrame
df = pd.DataFrame(d)
print ("Our object is:")
print df
print ("The total number of elements in our object is:")
print df.size

Nó là output như sau -

Our object is:
    Age   Name    Rating
0   25    Tom     4.23
1   26    James   3.24
2   25    Ricky   3.98
3   23    Vin     2.56
4   30    Steve   3.20
5   29    Smith   4.60
6   23    Jack    3.80

The total number of elements in our object is:
21

giá trị

Trả về dữ liệu thực tế trong DataFrame dưới dạng NDarray.

import pandas as pd
import numpy as np
 
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 
#Create a DataFrame
df = pd.DataFrame(d)
print ("Our object is:")
print df
print ("The actual data in our data frame is:")
print df.values

Nó là output như sau -

Our object is:
    Age   Name    Rating
0   25    Tom     4.23
1   26    James   3.24
2   25    Ricky   3.98
3   23    Vin     2.56
4   30    Steve   3.20
5   29    Smith   4.60
6   23    Jack    3.80
The actual data in our data frame is:
[[25 'Tom' 4.23]
[26 'James' 3.24]
[25 'Ricky' 3.98]
[23 'Vin' 2.56]
[30 'Steve' 3.2]
[29 'Smith' 4.6]
[23 'Jack' 3.8]]

Đầu & Đuôi

Để xem một mẫu nhỏ của đối tượng DataFrame, hãy sử dụng head() và phương thức tail (). head() trả về cái đầu tiên nhàng (quan sát các giá trị chỉ số). Số phần tử mặc định để hiển thị là năm phần tử, nhưng bạn có thể chuyển một số tùy chỉnh.

import pandas as pd
import numpy as np
 
#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]),
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}

#Create a DataFrame
df = pd.DataFrame(d)
print ("Our data frame is:")
print df
print ("The first two rows of the data frame is:")
print df.head(2)

Nó là output như sau -

Our data frame is:
    Age   Name    Rating
0   25    Tom     4.23
1   26    James   3.24
2   25    Ricky   3.98
3   23    Vin     2.56
4   30    Steve   3.20
5   29    Smith   4.60
6   23    Jack    3.80

The first two rows of the data frame is:
   Age   Name   Rating
0  25    Tom    4.23
1  26    James  3.24

tail() trả về cuối cùng nhàng (quan sát các giá trị chỉ số). Số phần tử mặc định để hiển thị là năm phần tử, nhưng bạn có thể chuyển một số tùy chỉnh.

import pandas as pd
import numpy as np

#Create a Dictionary of series
d = {'Name':pd.Series(['Tom','James','Ricky','Vin','Steve','Smith','Jack']),
   'Age':pd.Series([25,26,25,23,30,29,23]), 
   'Rating':pd.Series([4.23,3.24,3.98,2.56,3.20,4.6,3.8])}
 
#Create a DataFrame
df = pd.DataFrame(d)
print ("Our data frame is:")
print df
print ("The last two rows of the data frame is:")
print df.tail(2)

Nó là output như sau -

Our data frame is:
    Age   Name    Rating
0   25    Tom     4.23
1   26    James   3.24
2   25    Ricky   3.98
3   23    Vin     2.56
4   30    Steve   3.20
5   29    Smith   4.60
6   23    Jack    3.80

The last two rows of the data frame is:
    Age   Name    Rating
5   29    Smith    4.6
6   23    Jack     3.8