Khoa học dữ liệu nhanh nhẹn - Làm việc với các báo cáo

Trong chương này, chúng ta sẽ tìm hiểu về việc tạo báo cáo, đây là một mô-đun quan trọng của phương pháp nhanh. Các trang biểu đồ chạy nước rút nhanh được tạo bằng cách trực quan hóa thành các báo cáo đầy đủ. Với các báo cáo, biểu đồ trở nên tương tác, các trang tĩnh trở thành dữ liệu động và liên quan đến mạng. Các đặc điểm của giai đoạn báo cáo của tháp giá trị dữ liệu được trình bày dưới đây:

Chúng tôi sẽ căng thẳng hơn khi tạo tệp csv, tệp này có thể được sử dụng làm báo cáo để phân tích khoa học dữ liệu và rút ra kết luận. Mặc dù nhanh nhẹn tập trung vào ít tài liệu hơn, việc tạo báo cáo để đề cập đến tiến độ phát triển sản phẩm luôn được xem xét.

import csv
#----------------------------------------------------------------------
def csv_writer(data, path):
   """
      Write data to a CSV file path
   """
   with open(path, "wb") as csv_file:
   writer = csv.writer(csv_file, delimiter=',')
   for line in data:
   writer.writerow(line)
#----------------------------------------------------------------------
if __name__ == "__main__":
   data = ["first_name,last_name,city".split(","),
      "Tyrese,Hirthe,Strackeport".split(","),
      "Jules,Dicki,Lake Nickolasville".split(","),
      "Dedric,Medhurst,Stiedemannberg".split(",")
   ]
	
   path = "output.csv"
   csv_writer(data, path)

Đoạn mã trên sẽ giúp bạn tạo “tệp csv” như được hiển thị bên dưới -

Hãy để chúng tôi xem xét các lợi ích sau của báo cáo csv (các giá trị được phân tách bằng dấu phẩy) -

  • Nó thân thiện với con người và dễ dàng chỉnh sửa thủ công.
  • Nó rất đơn giản để thực hiện và phân tích cú pháp.
  • CSV có thể được xử lý trong tất cả các ứng dụng.
  • Nó nhỏ hơn và nhanh hơn để xử lý.
  • CSV tuân theo một định dạng chuẩn.
  • Nó cung cấp lược đồ đơn giản cho các nhà khoa học dữ liệu.