Âm mưu - Biểu đồ

Được giới thiệu bởi Karl Pearson, biểu đồ là một biểu diễn chính xác của phân phối dữ liệu số, là ước tính của phân phối xác suất của một biến liên tục (CORAL). Nó xuất hiện tương tự như biểu đồ thanh, nhưng, biểu đồ thanh liên quan đến hai biến, trong khi biểu đồ chỉ liên quan đến một.

Biểu đồ yêu cầu bin (hoặc là bucket) chia toàn bộ phạm vi giá trị thành một chuỗi các khoảng — và sau đó đếm số lượng giá trị rơi vào mỗi khoảng. Các thùng thường được chỉ định là các khoảng liên tiếp, không chồng chéo của một biến. Các thùng phải liền nhau và thường có kích thước bằng nhau. Một hình chữ nhật được dựng trên thùng với chiều cao tỷ lệ với tần số — số thùng trong mỗi thùng.

Đối tượng theo dõi biểu đồ được trả về bởi go.Histogram()chức năng. Tùy chỉnh của nó được thực hiện bởi các đối số hoặc thuộc tính khác nhau. Một đối số quan trọng là x hoặc y được đặt thành danh sách,numpy array hoặc là Pandas dataframe object được phân phối trong các thùng.

Theo mặc định, Plotly phân phối các điểm dữ liệu trong các thùng có kích thước tự động. Tuy nhiên, bạn có thể xác định kích thước thùng tùy chỉnh. Vì vậy, bạn cần đặt tự động thành false, hãy chỉ địnhnbins (số lượng thùng), giá trị bắt đầu và kết thúc và kích thước của nó.

Mã sau tạo ra một biểu đồ đơn giản hiển thị sự phân bố điểm của các sinh viên trong một lớp học (được định cỡ tự động) -

import numpy as np
x1 = np.array([22,87,5,43,56,73,55,54,11,20,51,5,79,31,27])
data = [go.Histogram(x = x1)]
fig = go.Figure(data)
iplot(fig)

Đầu ra như hình dưới đây -

Các go.Histogram() hàm chấp nhận histnorm, chỉ định kiểu chuẩn hóa được sử dụng cho dấu vết biểu đồ này. Mặc định là "", khoảng của mỗi thanh tương ứng với số lần xuất hiện (tức là số điểm dữ liệu nằm bên trong thùng). Nếu được giao"percent" / "probability", khoảng thời gian của mỗi thanh tương ứng với tỷ lệ phần trăm / phần nhỏ số lần xuất hiện đối với tổng số điểm mẫu. Nếu nó bằng "density", khoảng thời gian của mỗi thanh tương ứng với số lần xuất hiện trong một thùng chia cho kích thước của khoảng thời gian đó.

Ngoài ra còn có histfunc tham số có giá trị mặc định là count. Do đó, chiều cao của hình chữ nhật trên thùng tương ứng với số lượng điểm dữ liệu. Nó có thể được đặt thành tổng, trung bình, tối thiểu hoặc tối đa.

Các histogram()chức năng có thể được thiết lập để hiển thị phân phối tích lũy các giá trị trong các thùng liên tiếp. Để làm được điều đó, bạn cần đặtcumulative propertyđể kích hoạt. Kết quả có thể được nhìn thấy như dưới đây:

data=[go.Histogram(x = x1, cumulative_enabled = True)]
fig = go.Figure(data)
iplot(fig)

Đầu ra như được đề cập bên dưới -