Python Pandas - บทนำ

Pandas เป็น Python Library แบบโอเพนซอร์สที่ให้เครื่องมือจัดการและวิเคราะห์ข้อมูลประสิทธิภาพสูงโดยใช้โครงสร้างข้อมูลที่มีประสิทธิภาพ ชื่อ Pandas มาจากคำว่า Panel Data - เศรษฐมิติจากข้อมูลหลายมิติ

ในปี 2008 นักพัฒนา Wes McKinney เริ่มพัฒนาแพนด้าเมื่อต้องการเครื่องมือที่ยืดหยุ่นและมีประสิทธิภาพสูงในการวิเคราะห์ข้อมูล

ก่อนหน้า Pandas Python ถูกใช้เป็นหลักในการรวบรวมและเตรียมข้อมูล มีส่วนช่วยในการวิเคราะห์ข้อมูลน้อยมาก นุ่นแก้ปัญหานี้ เมื่อใช้ Pandas เราสามารถทำตามขั้นตอนทั่วไปห้าขั้นตอนในการประมวลผลและวิเคราะห์ข้อมูลโดยไม่คำนึงถึงที่มาของข้อมูล - โหลดเตรียมจัดการสร้างแบบจำลองและวิเคราะห์

Python with Pandas ถูกนำไปใช้ในหลากหลายสาขารวมถึงโดเมนทางวิชาการและการค้ารวมถึงการเงินเศรษฐศาสตร์สถิติการวิเคราะห์ ฯลฯ

คุณสมบัติหลักของหมีแพนด้า

  • วัตถุ DataFrame ที่รวดเร็วและมีประสิทธิภาพพร้อมการจัดทำดัชนีเริ่มต้นและกำหนดเอง
  • เครื่องมือสำหรับโหลดข้อมูลลงในออบเจ็กต์ข้อมูลในหน่วยความจำจากไฟล์รูปแบบต่างๆ
  • การจัดตำแหน่งข้อมูลและการจัดการข้อมูลที่ขาดหายไปในตัว
  • การปรับรูปแบบและการเปลี่ยนชุดวันที่
  • การแบ่งส่วนการสร้างดัชนีและการย่อยชุดข้อมูลขนาดใหญ่ตามป้ายชื่อ
  • คอลัมน์จากโครงสร้างข้อมูลสามารถลบหรือแทรกได้
  • จัดกลุ่มตามข้อมูลสำหรับการรวมและการแปลง
  • การรวมและการรวมข้อมูลที่มีประสิทธิภาพสูง
  • ฟังก์ชันอนุกรมเวลา