Agile Data Science - การแสดงข้อมูล

การแสดงภาพข้อมูลมีบทบาทสำคัญมากในวิทยาศาสตร์ข้อมูล เราสามารถพิจารณาการแสดงภาพข้อมูลเป็นโมดูลหนึ่งของวิทยาศาสตร์ข้อมูล Data Science มีมากกว่าการสร้างแบบจำลองการคาดการณ์ รวมถึงคำอธิบายของแบบจำลองและใช้เพื่อทำความเข้าใจข้อมูลและตัดสินใจ การแสดงภาพข้อมูลเป็นส่วนสำคัญของการนำเสนอข้อมูลด้วยวิธีที่น่าเชื่อที่สุด

จากมุมมองของวิทยาศาสตร์ข้อมูลการแสดงข้อมูลเป็นคุณลักษณะที่เน้นซึ่งแสดงการเปลี่ยนแปลงและแนวโน้ม

พิจารณาแนวทางต่อไปนี้เพื่อการแสดงข้อมูลที่มีประสิทธิภาพ -

  • วางตำแหน่งข้อมูลตามมาตราส่วนทั่วไป

  • การใช้แท่งจะมีประสิทธิภาพมากกว่าเมื่อเปรียบเทียบกับวงกลมและสี่เหลี่ยม

  • ควรใช้สีที่เหมาะสมสำหรับแปลงกระจาย

  • ใช้แผนภูมิวงกลมเพื่อแสดงสัดส่วน

  • การแสดงภาพ Sunburst มีประสิทธิภาพมากขึ้นสำหรับพล็อตแบบลำดับชั้น

Agile ต้องการภาษาสคริปต์ที่เรียบง่ายสำหรับการแสดงข้อมูลและการทำงานร่วมกันด้วยวิทยาศาสตร์ข้อมูล“ Python” เป็นภาษาที่แนะนำสำหรับการแสดงข้อมูล

ตัวอย่าง 1

ตัวอย่างต่อไปนี้แสดงให้เห็นภาพข้อมูลของ GDP ที่คำนวณในปีที่ระบุ “ Matplotlib” เป็นไลบรารีที่ดีที่สุดสำหรับการแสดงข้อมูลใน Python การติดตั้งไลบรารีนี้แสดงไว้ด้านล่าง -

พิจารณารหัสต่อไปนี้เพื่อทำความเข้าใจสิ่งนี้ -

import matplotlib.pyplot as plt
years = [1950, 1960, 1970, 1980, 1990, 2000, 2010]
gdp = [300.2, 543.3, 1075.9, 2862.5, 5979.6, 10289.7, 14958.3]

# create a line chart, years on x-axis, gdp on y-axis
plt.plot(years, gdp, color='green', marker='o', linestyle='solid')

# add a title plt.title("Nominal GDP")
# add a label to the y-axis
plt.ylabel("Billions of $")
plt.show()

เอาต์พุต

รหัสด้านบนสร้างผลลัพธ์ต่อไปนี้ -

มีหลายวิธีในการปรับแต่งแผนภูมิด้วยป้ายชื่อแกนลักษณะเส้นและเครื่องหมายจุด มาเน้นที่ตัวอย่างถัดไปซึ่งแสดงให้เห็นถึงการแสดงข้อมูลที่ดีขึ้น ผลลัพธ์เหล่านี้สามารถใช้เพื่อให้ได้ผลลัพธ์ที่ดีขึ้น

ตัวอย่าง 2

import datetime
import random
import matplotlib.pyplot as plt

# make up some data
x = [datetime.datetime.now() + datetime.timedelta(hours=i) for i in range(12)]
y = [i+random.gauss(0,1) for i,_ in enumerate(x)]

# plot
plt.plot(x,y)

# beautify the x-labels
plt.gcf().autofmt_xdate()
plt.show()

เอาต์พุต

รหัสด้านบนสร้างผลลัพธ์ต่อไปนี้ -